基于Neo4j的NBA球员知识图谱构建 - CSDN博客

文章推薦指數: 80 %
投票人數:10人

基于Neo4j的NBA球员知识图谱构建作为一个老JR,老早就像弄一个关于NBA的图谱了。

最近尝试使用Neo4j,一直苦于没有大规模的感兴趣的数据, ... 基于Neo4j的NBA球员知识图谱构建 五月的echo 于 2019-06-1611:27:45 发布 2000 收藏 19 文章标签: 知识图谱 Neo4j NBA 版权声明:本文为博主原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/qq_36618444/article/details/92383074 版权 基于Neo4j的NBA球员知识图谱构建 作为一个老JR,老早就像弄一个关于NBA的图谱了。

最近尝试使用Neo4j,一直苦于没有大规模的感兴趣的数据,所以就决定自己动手丰衣足食。

最后构建出来的东西,为了逼格高一点还是叫“知识图谱”,其实离真正牛逼的图谱还差很远。

由于数据直接爬取的虎扑,所以省去了大量的信息抽取的时间。

不得不说一句虎扑还是很程序员友好的,根本没有什么反爬机制,直接上代码,弄到所有球队的名字以及URL,球队详细的信息手懒没爬。

每一个球队的所有球员信息都用excel存起来。

#获取所有球队以及信息 defgetTeamUrl(): root='https://nba.hupu.com/teams'#获取所有球队的信息 response=requests.get(root) text=response.text soup=BS(text) h2s=soup.find_all('h2') teams=[] teamUrls=[] forh2inh2s: teams.append(h2.string) print(teams) urls=soup.find_all(name='a',attrs={'class':'a_teamlink'}) forurlinurls: teamUrls.append(url.get('href')) print(teamUrls) frame=pd.DataFrame(columns=['team','urls']) frame['team']=teams frame['urls']=teamUrls frame.to_excel('./data/teamUrls.xlsx') 有了数据就该定义知识图谱的schema了,为了简单就定义了两个entity:球队和球员,一种关系:效力于,球员的属性可以参照虎扑。

之后就将excel中的数据导入neo4j,这部分用了py2neo,直接pip安装就可以。

##连接neo4j数据库,输入地址、用户名、密码 graph=Graph('http://localhost:7474',username='neo4j',password='123456') #导入球队的数据 defimportTeam(): forroot,dirs,filesinos.walk('./data'): forfileinfiles: team=file.split('.')[0] node=Node('球队',name=team) graph.create(node) print(graph) py2neo中操作数据库需要三个类就差不多了: frompy2neoimportGraph,Node,Relationship 都可以通过Graph.create()直接创建结点或者关系。

导入关系的时候需要考虑NBA是一个商业联盟,球员老被交易,每个人可能会效力几只不同的球队,所以“效力于”这个关系需要添加个时间属性,表示这个球员在某个时间段效力于这支球队。

整个过程也就导入球员关系复杂一些。

defimportRelation(): forroot,dirs,filesinos.walk('./data'): forfileinfiles: frame=pd.read_excel('./data/'+file) team=file.split('.')[0] foriinframe.index: player=frame.get_value(i,'players') career=str(frame.get_value(i,'生涯球队')).split() career_dict={} forjinrange(int(len(career)/2)): year=career[j*2] teamBefore=career[j*2+1] ifteamBeforeincareer_dict.keys(): career_dict[teamBefore]+=(year+'') else: career_dict[teamBefore]=year+'' #最后加入当前效力的球队 ifteamincareer_dict.keys(): career_dict[team]+='2019' else: career_dict[team]='2019' #最后创建关系 a=graph.nodes.match('球员',name=player).first() forkeyincareer_dict.keys(): b=graph.nodes.match('球队',name=key).first() relat=Relationship(a,'效力于',b) relat['year']=career_dict[key].strip() try: graph.create(relat) except: continue 最后得到497位球员,当然是30支球队,1099条关系。

为了规整做了一个LIMIT,只显示100条关系至于各种条件查询以后再练习吧,吃饭去咯。

五月的echo 关注 关注 5 点赞 踩 12 评论 19 收藏 打赏 扫一扫,分享内容 点击复制链接 评论 12 您还未登录,请先 登录 后发表或查看评论 相关推荐 超详细:通过neo4j构建数电知识图谱 11-01 830 将neo4j->连接mysql CALLapoc.load.jdbc() 创建节点 ranker代表课程id,name代表该学科名称 create(n:course{name:'数字电路与逻辑设计',ranker:'4'})returnn; 建立课程下面的一级目录—既每章的标题 首先是创建node: CALLapoc.load.jdbc('jdbc:mysql://10.112.48.129/knowledgePoint_PPT? user=*填写你的账号*& 【知识图谱】Neo4j导入数据构建知识图谱的三种方法 Nieson2012的专栏 10-30 8456 目录 Neo4j数据导入5种方式 1、使用Cypher语言创建 1.1创建节点【create】 1.2修改节点的属性 1.3创建带属性值的节点 1.4创建节点间的关系 1.5其他操作命令 1.6cypher查询语言的使用规律 2、使用loadcsv导入数据 2.1构建容器(非必须) 2.2导入节点csv文件 2.3创建索引并删除重复节点 2.4导入关... NBA比赛数据分析与预测 你好哇 11-01 1万+ 我的任务利用13到16年的NBA比赛统计数据,去预测17年的每场NBA比赛。

数据是从http://www.basketball-reference.com/这个网站获得的。

前期参考了https://www.shiyanlou.com/courses/782/labs/2647/document这里的分析与实现方法。

这个实验楼里实现用了LogisticRegression。

现在我想对数据做一些预处理 知识图谱—知识存储—仅用neo4j搭建简单的金融知识图谱 m0_37565948的博客 07-20 3万+ 一、任务描述 本文章旨在用neo4j构建一个简单的金融领域的知识图谱,挖掘“高管—上市企业—行业/概念”之间的关系。

关于具体的任务描述可下载我百度网盘的链接。

链接:https://pan.baidu.com/s/12v0df74Y1kW0WHiJTvQZpQ密码:q9hm 二、数据清洗,生成csv文件 项目介绍,通过百度网盘下载下来的文件夹—tanXinKg... 从零开始使用Neo4j构建知识图谱(一) Always-Learning 01-31 3131 一、安装Neo4j 下面是官方文档:https://neo4j.com/download/通过上述网址下载后,记住弹出的key,后续软件的激活需要使用到这个key。

二、基础使用方法 新建项目 2.更改项目名 建立本地数据库或者远程数据库 启动本地数据库 通过Neo4jBroswer进行操作 节点操作 创建节点 create(:大学{name:"西安电子科技大学"}) 查看构建好的节点图 调整节点显示字体的大小 获取所有节点 match(n)retu 基于图形数据库构建关于NBA球星的知识图谱并实行可视化 weixin_43361158的博客 08-13 313 https://www.ownthink.com/knowledge.html?word=%E5%BA%93%E9%87%8C 知识图谱入门——知识抽取与挖掘(II) du_ok'sNotes 12-23 7539 文章首发于博客du_ok’sNotes,本文链接为知识图谱入门——知识抽取与挖掘(II) 本文介绍了一些知识挖掘的方法,包括实体消歧与链接、知识规则挖掘和知识图谱表示学习。

知识抽取之后可以获得一些结构化的知识,而知识挖掘则是从结构化的知识推理出新的知识,例如挖掘出新的实体、新的关联规则等。

知识的消歧与链接:基于内容的挖掘 知识规则挖掘:基于结构的挖掘 知识图谱表示学习 实体消歧与... 权力的游戏击杀和家族知识图谱(python+neo4j) 韩明宇 06-21 2036 一、任务描述 数据集是github上某大神整理出来的全八季任务信息,包括姓名、家族、杀了谁、被谁杀了等等。

本文做的知识图谱仅包含所有人物及其被杀关系和家族关系。

数据集链接:https://github.com/jeffreylancaster/game-of-thrones/blob/master/data/characters.json 二、neo4j的安装和部署 参考:https:/... 知识图谱构建 qq_27374315的博客 01-22 1117 知识图谱构建 1.知识图谱 知识图谱的定义 知识图谱最先由Google提出,是用于增强其搜索引擎功能的知识库。

本质上,知识图谱旨在描述真实世界中存在的各种实体或概念及其关系,其构成一张巨大的语义网络图,节点表示实体或概念,边则由属性或关系构成。

现在的知识图谱已被用来泛指各种大规模的知识库。

知识图谱中包含三种节点: 实体:指的是具有可区别性且独立存在的某种事物,如某一个人等 属性(值):从一个... 用ltp提取文本关系并创建知识图谱(基于neo4j) m0_50294896的博客 05-19 1509 LTP提供了一系列中文自然语言处理工具,用户可以使用这些工具对于中文文本进行分词、词性标注、句法分析等等工作。

ltp的官方文档里演示了分词,句法分析,语义依存关系提取等简单demo。

本文在此基础上,将提取出的语义依存关系构建出知识图谱,使用的是neo4j平台。

同时本文也会演示怎么使用python在neo4j上创建图谱。

neo4j的安装比较简单,请自行查阅。

用ltp创建知识图谱至少需要3个信息: 节点类型 节点名字 节点间的关系 使用ltp提取文本关系: 本文只是简单演示,分析的句子是:他叫汤姆去拿外 知识图谱-Neo4j构建你的第一个知识图谱 享受旅行中的VIP快乐 03-29 1040 目标:根据已有数据集,构建一个用户-商品的知识图谱 索引1.寻找数据2.节点分析3.知识图谱的构建3.1安装并打开Neo4j3.2导入节点3.3导入节点之间的关系3.查看并操作知识图谱 1.寻找数据 构建知识图谱时首先需要获取数据。

可以自己在网上爬取数据,也可以用现有的数据集 本文使用的是Women’sE-CommerceClothingReviews 数据集属性对应如下: 数据集... Neo4j从入门到构建一个简单知识图谱 h471507602的博客 07-03 1万+ Neo4j对于大多数人来说,可能是比较陌生的。

其实,Neo4j是一个图形数据库,就像传统的关系数据库中的Oracel和MySQL一样,用来持久化数据。

Neo4j是最近几年发展起来的新技术,属于NoSQL数据库中的一种。

本文主要从Neo4j为什么被用来做知识图谱,Neo4j的简单安装,在Neo4j浏览器中创建节点和关系,Neo4j的Python接口操作以及用Ne... 利用Neo4j构建知识图谱 最新发布 immortlug的博客 03-30 4972 Neo4j是一个开源图形数据库,它将结构化数据存储在网络上,具有成熟数据库的所有特性,可以被看作是一个高性能的图引擎。

本文围绕利用Neo4j构建知识图谱进行了详细说明,并对其中遇到的问题进行解答。

第20课:Neo4j从入门到构建一个简单知识图谱 春华秋实 09-22 1910 Neo4j对于大多数人来说,可能是比较陌生的。

其实,Neo4j是一个图形数据库,就像传统的关系数据库中的Oracel和MySQL一样,用来持久化数据。

Neo4j是最近几年发展起来的新技术,属于NoSQL数据库中的一种。

本文主要从Neo4j为什么被用来做知识图谱,Neo4j的简单安装,在Neo4j浏览器中创建节点和关系,Neo4j的Python接口操作以及用Neo... 利用lm()预测NBA常规赛前16强 09-17 利用lm()+boruta算法预测NBA常规赛前16强,准确率达到14/16。

包括模型的建立以及算法的评估。

NBA季后赛成绩分析及预测 07-10 球队得分为因变量,本球队与对手投篮命中率、篮板对比、助攻对比等,评判一个球队的实力,使用逻辑回归和贝叶斯回归作分析,并使用ROC曲线判断各指标对对综合得分的影响程度,得出最终判别模型后,得出各球队的经济实力,并进行比较 Neo4j构建知识图谱 weixin_42631192的博客 09-10 1026 知识图谱的一些概念和实战 参考:(https://blog.csdn.net/m0_37565948/article/details/81133041) 教程: 参考:(https://www.w3cschool.cn/neo4j/neo4j_spring_data_example.html) 利用neo4j创建知识图谱 tanglizoe的博客 04-08 2172 导入实体csv文件 USINGPERIODICCOMMIT10 LOADCSVFROM"file:///disease.csv"ASline create(a:疾病{diseaseId:line[0],name:line[1],type:line[2]}) 导入关系csv文件 USINGPERIODICCOMMIT10 LOADCSVFROM"file:///r... 一文教你用Neo4j快速构建明星关系图谱 weixin_34138521的博客 04-01 457 前言本文将带你用neo4j快速实现一个明星关系图谱,因为拖延的缘故,正好赶上又一年的4月1日,于是将文中的几个例子顺势改成了“哥哥”张国荣。

正所谓“巧妇难为无米之炊”,本次爬取娱乐圈_专业的娱乐综合门户网站下属“明星”页的“更多明星”里所有9141条数据。

筛选出个人主页中含“明星关系”的数据,进一步爬取并解析出后续关系图谱所需的数据。

以“张国荣-个人主页”为例,其直接相关的明星并不多,可见数据... 知识图谱和Neo4j图数据库 热门推荐 ThinkInJAVA—Max 09-04 3万+ 一、知识图谱          互联网、大数据的背景下,谷歌、百度、搜狗等搜索引擎纷纷基于该背景,创建自己的知识图谱KnowledgeGraph(谷歌)、知心(百度)和知立方(搜狗),主要用于改进搜索质量。

1、什么是知识图谱     一种基于图的数据结构,由节点(Point)和边(Edge)组成。

其中节点即实体,由一个全局唯一的ID标示,关系(也称属性))用于连接 “相关推荐”对你有帮助么? 非常没帮助 没帮助 一般 有帮助 非常有帮助 提交 ©️2022CSDN 皮肤主题:技术黑板 设计师:CSDN官方博客 返回首页 五月的echo CSDN认证博客专家 CSDN认证企业博客 码龄6年 暂无认证 138 原创 6万+ 周排名 1万+ 总排名 19万+ 访问 等级 2627 积分 670 粉丝 188 获赞 230 评论 765 收藏 私信 关注 热门文章 Python日记(三):numpy矩阵以及Torch张量骚操作 27708 Webofscience以及中国知网学术论文爬取教程(附代码) 19642 Transformer原理以及文本分类实战 7819 pytorch使用GPU加速所需各种配置以及实战 7498 python日记(二):密集计算加速(双重for循环为例) 4200 分类专栏 低资源本文分类 付费 17篇 图神经网络2021 付费 20篇 GNNModel 付费 30篇 GNNinKG 付费 7篇 文本分类 7篇 GNNNLP 18篇 ACL2021 3篇 GNNPooling 11篇 Python基础 4篇 最新评论 ICLR2021-1:MULTI-HOPATTENTIONGRAPHNEURALNETWORKS yypSandra: 您好,请问您知道这篇文章的源代码是否公开吗?如果公开,有没有链接呢? SetTransformer原理以及源码解读 qq_41215273: self.fc_q=nn.Linear(dim_Q,dim_V)#自注意力KQV参数 self.fc_k=nn.Linear(dim_K,dim_V) self.fc_v=nn.Linear(dim_K,dim_V) 使用这是三个矩阵生成Q,K,V,如果输入X的顺序变了,但是这三个矩阵参数不变,产生的Q,K,V肯定不相同,这样就不满足置换不变性了呀? Neo4jDesktop图数据库导出 五月的echo: 可以的,可以去尝试一下相关的命令行导入,网上教程应该有很多的 GNNPooling(三):AnEnd-to-EndDeepLearningArchitectureforGraphClassification,AAAI2018;以及图核 Zeno'scat: sorry,找到了,原来在DGCNN_embedding.py里面 GNNPooling(三):AnEnd-to-EndDeepLearningArchitectureforGraphClassification,AAAI2018;以及图核 Zeno'scat: 引用「我最终是看了github的源码才确定这一点的」 博主你好,请问你看的源码地址是论文作者github.com/muhanzhang的吗?为什么我没找到图中的代码?方便告知吗? 您愿意向朋友推荐“博客详情页”吗? 强烈不推荐 不推荐 一般般 推荐 强烈推荐 提交 最新文章 文本对比学习综述 在自己的数据集上重新训练BERT(附代码) TheMostCommonHabitsfrommorethan200EnglishPaperswrittenbyGraduateChineseStudents 2022年30篇 2021年47篇 2020年58篇 2019年3篇 目录 目录 分类专栏 低资源本文分类 付费 17篇 图神经网络2021 付费 20篇 GNNModel 付费 30篇 GNNinKG 付费 7篇 文本分类 7篇 GNNNLP 18篇 ACL2021 3篇 GNNPooling 11篇 Python基础 4篇 目录 打赏作者 五月的echo 你的鼓励将是我创作的最大动力 ¥2 ¥4 ¥6 ¥10 ¥20 输入1-500的整数 余额支付 (余额:--) 扫码支付 扫码支付:¥2 获取中 扫码支付 您的余额不足,请更换扫码支付或充值 打赏作者 实付元 使用余额支付 点击重新获取 扫码支付 钱包余额 0 抵扣说明: 1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。

2.余额无法直接购买下载,可以购买VIP、C币套餐、付费专栏及课程。

余额充值



請為這篇文章評分?