github 中文知识图谱 - CSDN
文章推薦指數: 80 %
近日,一直致力于知识图谱研究的OwnThink 平台在Github 上开源了史上最大规模1.4 亿中文知识图谱,其中数据是以(实体、属性、值),(实体、关系、实体)混合的形式 ...
精华内容
下载资源
问答
我要提问
github中文知识图谱
知识图谱构建流程原型、工具、数据、表示、推理以及可视化
千次阅读
2022-02-2111:03:30
知识图谱开源数据:开源图谱评测数据
MSRA-NER实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/MSRA人民日报实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/people_daily新浪微博实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/weiboCLUENER细粒度实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/cluener_publicYidu-S4K医疗命名实体识别数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/yidu-s4k面向试验鉴定的实体数据集https://www.biendata.xyz/competition/ccks_2020_8/BosonNLP实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/boson影视音乐书籍实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/video_music_book_datasets中文电子病历实体数据集https://www.biendata.xyz/competition/CCKS2017_2中文电子简历实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/ResumeNERCoNLL2003数据集https://www.clips.uantwerpen.be/conll2003/ner/OntoNotes5.0数据集https://catalog.ldc.upenn.edu/ldc2013t19ACE实体关系数据集https://catalog.ldc.upenn.edu/byprojectSemEval实体关系数据集https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_semeval.shFewRel实体关系数据集https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_fewrel.shWiki80实体关系数据集https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_wiki80.shNYT10实体关系数据集https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_nyt10.shDulE2.0实体关系数据集https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/information_extraction/DulECOAE2016实体关系数据集https://ccir2016.ccnl.scut.edu.cn/caoe_test.php人物实体关系数据集https://github.com/SUDA-HLT/IPREChineseLiteratureText文档级实体关https://github.com/lancopku/Chinese-Literature-NER-RE-DatasetDocRED文档级实体关系数据集https://github.com/thunlp/DocREDACE事件袖取数据集https://github.com/n/pcl-lab/ace2005-preprocessing医疗事件抽取数据集https://www.biendata.xyz/competition/ccks_2020_2_1/CCKS2020金融领城小样本迁移事件抽取数据集https://www.biendata.xvz/competitior/ccks_2020_3/CCKS202D金融领域事件主体拍取数据集https://www.biendata.xyz/competition/ccks_2020_4_1/data/CCK52020金融领域的篇章级事件拍取数据集https://www.biendata.xyz/competition/ccks_2020_4_2/data/CCKS2021金融领域篇章级事件抽取数据集https://www.biendata.xyz/competition/ccks_2021_task6_1/data/DuEE-Fin算章级事件抽取数据集https://astudio.baidu.com/astudo/compatition/detai/65/0/introductionB、DuEE百度中文句子级事件抽取数据集https://aistudio.baidu.com/aistud.o/projectdetail/1639964科大讯飞开放城事件抽取数据集http://challenge.xtyun.cn/topic/info?type=hotspotCCKS2021通用组粒度事件检测数据集https://biendata.xyz/competition/ocks_2021_maver/data/CEC事件抽凰数据集https://codechins.csdn.net/mirrcr/shiiiebei2009/CEC-Corpus面向金融领域的篇章级事件因果关系抽取数据集https://endata.xyz/competition/ocks_2021_task6_2/data/SemEva/SCIF句子级因果事件关系数据集https://ait.ocn.0semey1:201/ndex.phooid=tassFB15k知识表示数据集https://web.informatik.uni-mannheim.de/pi1/kge-datasets/fb15k.tar.gzFB15k-237知识表示数据集https://mannheim.de/pi1/kge-datasets/fb15k-237.tar.gzWN18知识表示数据集https://veinformatik.uni-mannheimde/pi1/kge-datasets/wn18.tar.gzWN18rr知识表示数据集https://web.infomatik.un-mannheim.de/pi1/kge-datasets/wnm.tar.gzYAGO3-10知识表示数据集https://web.informatik.uni-mannheim.de/pi1/kge-datasets/yago3-10.tar.qzogbl-biokg知识表示数据集https://github.com/snap-stanford/ogbogbl-wikikg2知识表示数据集https://github.com/snap-stanford/ogbNLPCC2013中文微博实体链接数据集http://www.softcont.com/e/nlpcc2013/2014年NLPCC实体链接数据集http://toci.ccf.crg.cr/conference/2014/pages/pape04_tdata.html2015年NLPCC实体链接数据集https://www.biendata.xyz/ccf.toc_tcci2018/datasets/toci_tag/2KBP2017实体链接数据集http://nlp.cs.rci.edu/kbo/2017/KBP2019实体链接数据集http://nlc.cs.rci.edu/kbo./2019/CCKS2019中文短文本实体链指数据集https://biendata.xyz/competition/ccks_2019_elvCCXS2020中文短文本的实体链接数据集https://www.biendata.xvz/competition/ocks_2020_el/知识工厂实体链接数据集https://github.com/lhiclh/chinese_entity_linking
知识图谱开源工具:知识本体构建工具
protégéhttps://protege.stanford.eduNeOnToolkithttp://neon-toolkit.org/wiki/Main_Page.htmlAltovaSemanticWorkshttps://www.lesliesikos.com/TopBraidComposerhttp://www.topquadrant.com/思维导图https://www.xmind.cn/xmind8-pro/
知识图谱开源工具:知识标注开源工具
YEDDA/SUTDAnnotatorhttps://github.com/jiesutd/YEDDA适合做个人实验的轻量级实体标注Chinese-Annotatorhttps://github.com/crownpku/Chinese-Annotator适合做文本分类标注Brathttps://github.com/nlplab/brat功能最全,学术界用的较多doccanohttps://github.com/doccano除实体关系、事件要素、事件关系不能标之外均可Marktoolhttps://github.com/chosendai/MarkTool持续维护,功能最全
知识图谱开源工具:知识抽取工具
DeepKEhttps://github.com/zjunlp/deepkeOpenNREhttps://github.com/thunlp/OpenNRE.gitDeepDivehttps://www.openkg.cn/dataset/cn-deepdive
知识图谱开源工具:大规模图谱存储工具
原则:图数据库不都是最佳选择,mongodb有时很受欢迎,RDF工业界基本不用
根据具体的数据规模及应用场景合理选择不涉及多跳查询的场景可选择合适的关系型数据库涉及多跳查询、最短路径、推理分析等可考虑RDF数据库工业界常用图数据库
Neo4j图数据库https://neo4j.comHugeGraphhttps://hugegraph.github.io/hugegraph-doc/NebulaGraphhttps://github.com/microsoft/SPTAG
知识图谱开源工具:图算法计算工具
PyTorchGeometric(PyG)https://github.com/rusty1s/tf_geometrichttps://github.com/Craw/Script/tf_geometricDeepGraphLibrary(DGL)https://github.com/dmlc/dglCogDLhttps://github.com/THUDM/cogdlGraphEmbeddinghttps://github.com/shenweichen/GraphEmbeddingSparkGraphXhttp://spark.apache.org/graphx/networkxhttps://networkx.orgPlatohttps://github.com/tencent/plato
知识图谱开源工具:知识融合工具
Dedupehttps://github.com/dedupeio/dedupeFalcon-Aohttp://ws.nju.edu.cn/falcon-ao/LIMEShttps://github.com/dice-group/LIMESOpenEAhttps://github.com/nju-websoft/OpenEAPRASEMaphttps://github.com/qizhyuan/PRASEMap
知识图谱开源工具:知识表示工具
DGL-KEhttps://github.com/awslabs/dgl-keOpenKEhttps://github.com/thunlp/OpenKEpykg2vechttps://github.com/Sujit-O/pykg2vecGraphVitehttps://github.com/DeepGraphLearning/graphvitePytorch-BigGraphhttps://github.com/facebookresearch/PyTorch-BigGraph
知识图谱开源工具:图谱可视化工具
D3.jshttps://observablehq.com/@d3/galleryVis.jshttps://visjs.github.io/vis-network/examples/Echartshttps://echarts.apache.orgAntvG6https://www.yuque.com/antv/g6/intro
知识图谱开源工具:大规模图谱搜索工具
Elasticsearchhttps://www.elastic.co/cn/FAISShttps://github.com/facebookresearch/faissSPTAGhttps://github.com/microsoft/SPTAGVearchhttps://github.com/vearch/vearchMilvushttps://milvus.io/
人工智能
自然语言处理
更多相关内容
GitHub开源史上最大规模中文知识图谱
万次阅读
多人点赞
2019-10-2917:47:20
近日,一直致力于知识图谱研究的OwnThink平台在Github上开源了史上最大规模1.4亿中文知识图谱,其中数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式。
近日,一直致力于知识图谱研究的OwnThink平台在Github上开源了史上最大规模1.4亿中文知识图谱,其中数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式。
到目前为止,OwnThink项目开放了对话机器人、知识图谱、语义理解、自然语言处理工具。
知识图谱融合了两千五百多万的实体,拥有亿级别的实体属性关系,机器人采用了基于知识图谱的语义感知与理解,致力于最强认知大脑。
自然语言处理工具包的功能有:中文分词、词性标注、命名实体识别、关键词提取、文本摘要、新词发现、情感分析等。
在OwnThink平台首页上滚动着各种关键词,用户也可输入自己想要查询的知识,然后就可以得出相应的知识图谱。
OwnThink知识图谱还可以应用于机器人问答系统、知识推荐等等。
下图为知识图谱在机器人上的应用。
OwnThink支持在线API调用,感兴趣的小伙伴可以调测使用,使用Python进行对话机器人简单调用测试。
importjson
importrequests
sess=requests.get('https://api.ownthink.com/bot?spoken=中国')
answer=sess.text
answer=json.loads(answer)
print(answer)
效果如下:
GitHub地址:https://github.com/ownthink/KnowledgeGraphData
OwnThink网站地址:https://www.ownthink.com/
收起
展开全文
史上最大中文知识图谱,规模达1.4亿,现开源下载!
千次阅读
2019-10-2108:15:00
公众号关注“GitHubDaily”设为“星标”,每天带你逛GitHub!转自量子位,作者郭一璞最近,一份规模达1.4亿的知识图谱被开源了,而且还是中文。
开源贡...
公众号关注 “GitHubDaily”
设为“星标”,每天带你逛GitHub!
转自量子位,作者郭一璞
最近,一份规模达1.4亿的知识图谱被开源了,而且还是中文。
开源贡献者是一位个人开发者Yener,这也是目前已开源的最大规模的中文知识图谱。
你可以在下面这个网站上查看该知识图谱中的具体内容:
https://www.ownthink.com/
比如,我们输入“周杰伦”。
此时周杰伦的一些歌曲、电影、所获奖项就都出现了,还有他的出生地、星座、血型等个人信息。
点一下“七里香”,就会延伸到《七里香》这首歌的更多信息。
比如它的风格、发行地、唱片公司等,你还可以接着点,比如点“普通话”。
这里就出现了普通话的历史、来源、发源地等信息。
贡献者Yener在微博表示,该知识图谱是实时更新的,也就是说它的规模还可能会变得更大。
不过,它的实时更新也和数据的来源有关,比如我们输入“美元”这个词。
这时该知识图谱中显示的汇率并非当天汇率,而是和百度百科一致,因此该知识图谱中和百度百科一样,备注了汇率的更新时间。
另外,Yener的平台OwnThink上还有一个聊天机器人,一些知识图谱里包含的问题,机器人会给予解答。
不过有时候这只机器人还是挺调皮的,不一定每次都会告诉你答案是什么。
这只机器人已经开放了API接口,如果需要的话,你可以把他接到微信或者网页上。
GitHub:https://github.com/ownthink/KnowledgeGraphData
---
以上,便是今日分享,觉得不错,还请点个在看,谢谢~
推荐阅读:
霸榜GitHub,只用1MB,就能识别出你这张脸!
在对比了GitHub5000个Python项目之后,我们精选出了这36个!
GitHub标星2.7w+!超全大厂面试笔记整理!
「GitHub交流群」已开放
想入群的可在公众号后台回复「入群」
收起
展开全文
介绍一些知识图谱的实际应用类项目
千次阅读
2020-10-2610:05:00
目前已经有很多方法来构建知识图谱,在实际项目中,我们更加关注可以用构建好的知识图谱来干些什么,因此,我找到了网上一些对于当前知识图谱的应用的介绍,分享给大家。
...中文知识图谱OpenKG,CN-DB
目前已经有很多方法来构建知识图谱,在实际项目中,我们更加关注可以用构建好的知识图谱来干些什么,因此,我找到了网上一些对于当前知识图谱的应用的介绍,分享给大家。
1国内外知识图谱项目
国外:
常识知识库:Cyc、WordNet、ConceptNet等。
互联网知识图谱:主要有FreeBase、DBpedia、Schema、Wikidata、BableNet、MicrosofotConceptGraph,医疗领域LinkedLifeData等。
国内:
中文知识图谱OpenKG,CN-DBpedia,中医药知识图谱,阿里电商知识图谱、美团知识图谱、XLore(清华大学)、Belief-Eigen(中科院)、PKUPie(北京大学)等。
开放类的中文百科知识图谱http://zhishi.me等。
2最新的知识图谱搜索引擎Magi
Magi是由
PeakLabs研发的基于机器学习的信息抽取和检索系
github中文知识图谱-CSDN
精华内容
下载资源
问答
我要提问
github中文知识图谱
知识图谱构建流程原型、工具、数据、表示、推理以及可视化
千次阅读
2022-02-2111:03:30
知识图谱开源数据:开源图谱评测数据
MSRA-NER实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/MSRA人民日报实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/people_daily新浪微博实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/weiboCLUENER细粒度实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/cluener_publicYidu-S4K医疗命名实体识别数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/yidu-s4k面向试验鉴定的实体数据集https://www.biendata.xyz/competition/ccks_2020_8/BosonNLP实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/boson影视音乐书籍实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/video_music_book_datasets中文电子病历实体数据集https://www.biendata.xyz/competition/CCKS2017_2中文电子简历实体数据集https://github.com/GuocaiL/nlp_corpus/tree/main/open_ner_data/ResumeNERCoNLL2003数据集https://www.clips.uantwerpen.be/conll2003/ner/OntoNotes5.0数据集https://catalog.ldc.upenn.edu/ldc2013t19ACE实体关系数据集https://catalog.ldc.upenn.edu/byprojectSemEval实体关系数据集https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_semeval.shFewRel实体关系数据集https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_fewrel.shWiki80实体关系数据集https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_wiki80.shNYT10实体关系数据集https://github.com/thunlp/OpenNRE/blob/master/benchmark/download_nyt10.shDulE2.0实体关系数据集https://github.com/PaddlePaddle/PaddleNLP/tree/develop/examples/information_extraction/DulECOAE2016实体关系数据集https://ccir2016.ccnl.scut.edu.cn/caoe_test.php人物实体关系数据集https://github.com/SUDA-HLT/IPREChineseLiteratureText文档级实体关https://github.com/lancopku/Chinese-Literature-NER-RE-DatasetDocRED文档级实体关系数据集https://github.com/thunlp/DocREDACE事件袖取数据集https://github.com/n/pcl-lab/ace2005-preprocessing医疗事件抽取数据集https://www.biendata.xyz/competition/ccks_2020_2_1/CCKS2020金融领城小样本迁移事件抽取数据集https://www.biendata.xvz/competitior/ccks_2020_3/CCKS202D金融领域事件主体拍取数据集https://www.biendata.xyz/competition/ccks_2020_4_1/data/CCK52020金融领域的篇章级事件拍取数据集https://www.biendata.xyz/competition/ccks_2020_4_2/data/CCKS2021金融领域篇章级事件抽取数据集https://www.biendata.xyz/competition/ccks_2021_task6_1/data/DuEE-Fin算章级事件抽取数据集https://astudio.baidu.com/astudo/compatition/detai/65/0/introductionB、DuEE百度中文句子级事件抽取数据集https://aistudio.baidu.com/aistud.o/projectdetail/1639964科大讯飞开放城事件抽取数据集http://challenge.xtyun.cn/topic/info?type=hotspotCCKS2021通用组粒度事件检测数据集https://biendata.xyz/competition/ocks_2021_maver/data/CEC事件抽凰数据集https://codechins.csdn.net/mirrcr/shiiiebei2009/CEC-Corpus面向金融领域的篇章级事件因果关系抽取数据集https://endata.xyz/competition/ocks_2021_task6_2/data/SemEva/SCIF句子级因果事件关系数据集https://ait.ocn.0semey1:201/ndex.phooid=tassFB15k知识表示数据集https://web.informatik.uni-mannheim.de/pi1/kge-datasets/fb15k.tar.gzFB15k-237知识表示数据集https://mannheim.de/pi1/kge-datasets/fb15k-237.tar.gzWN18知识表示数据集https://veinformatik.uni-mannheimde/pi1/kge-datasets/wn18.tar.gzWN18rr知识表示数据集https://web.infomatik.un-mannheim.de/pi1/kge-datasets/wnm.tar.gzYAGO3-10知识表示数据集https://web.informatik.uni-mannheim.de/pi1/kge-datasets/yago3-10.tar.qzogbl-biokg知识表示数据集https://github.com/snap-stanford/ogbogbl-wikikg2知识表示数据集https://github.com/snap-stanford/ogbNLPCC2013中文微博实体链接数据集http://www.softcont.com/e/nlpcc2013/2014年NLPCC实体链接数据集http://toci.ccf.crg.cr/conference/2014/pages/pape04_tdata.html2015年NLPCC实体链接数据集https://www.biendata.xyz/ccf.toc_tcci2018/datasets/toci_tag/2KBP2017实体链接数据集http://nlp.cs.rci.edu/kbo/2017/KBP2019实体链接数据集http://nlc.cs.rci.edu/kbo./2019/CCKS2019中文短文本实体链指数据集https://biendata.xyz/competition/ccks_2019_elvCCXS2020中文短文本的实体链接数据集https://www.biendata.xvz/competition/ocks_2020_el/知识工厂实体链接数据集https://github.com/lhiclh/chinese_entity_linking
知识图谱开源工具:知识本体构建工具
protégéhttps://protege.stanford.eduNeOnToolkithttp://neon-toolkit.org/wiki/Main_Page.htmlAltovaSemanticWorkshttps://www.lesliesikos.com/TopBraidComposerhttp://www.topquadrant.com/思维导图https://www.xmind.cn/xmind8-pro/
知识图谱开源工具:知识标注开源工具
YEDDA/SUTDAnnotatorhttps://github.com/jiesutd/YEDDA适合做个人实验的轻量级实体标注Chinese-Annotatorhttps://github.com/crownpku/Chinese-Annotator适合做文本分类标注Brathttps://github.com/nlplab/brat功能最全,学术界用的较多doccanohttps://github.com/doccano除实体关系、事件要素、事件关系不能标之外均可Marktoolhttps://github.com/chosendai/MarkTool持续维护,功能最全
知识图谱开源工具:知识抽取工具
DeepKEhttps://github.com/zjunlp/deepkeOpenNREhttps://github.com/thunlp/OpenNRE.gitDeepDivehttps://www.openkg.cn/dataset/cn-deepdive
知识图谱开源工具:大规模图谱存储工具
原则:图数据库不都是最佳选择,mongodb有时很受欢迎,RDF工业界基本不用
根据具体的数据规模及应用场景合理选择不涉及多跳查询的场景可选择合适的关系型数据库涉及多跳查询、最短路径、推理分析等可考虑RDF数据库工业界常用图数据库
Neo4j图数据库https://neo4j.comHugeGraphhttps://hugegraph.github.io/hugegraph-doc/NebulaGraphhttps://github.com/microsoft/SPTAG
知识图谱开源工具:图算法计算工具
PyTorchGeometric(PyG)https://github.com/rusty1s/tf_geometrichttps://github.com/Craw/Script/tf_geometricDeepGraphLibrary(DGL)https://github.com/dmlc/dglCogDLhttps://github.com/THUDM/cogdlGraphEmbeddinghttps://github.com/shenweichen/GraphEmbeddingSparkGraphXhttp://spark.apache.org/graphx/networkxhttps://networkx.orgPlatohttps://github.com/tencent/plato
知识图谱开源工具:知识融合工具
Dedupehttps://github.com/dedupeio/dedupeFalcon-Aohttp://ws.nju.edu.cn/falcon-ao/LIMEShttps://github.com/dice-group/LIMESOpenEAhttps://github.com/nju-websoft/OpenEAPRASEMaphttps://github.com/qizhyuan/PRASEMap
知识图谱开源工具:知识表示工具
DGL-KEhttps://github.com/awslabs/dgl-keOpenKEhttps://github.com/thunlp/OpenKEpykg2vechttps://github.com/Sujit-O/pykg2vecGraphVitehttps://github.com/DeepGraphLearning/graphvitePytorch-BigGraphhttps://github.com/facebookresearch/PyTorch-BigGraph
知识图谱开源工具:图谱可视化工具
D3.jshttps://observablehq.com/@d3/galleryVis.jshttps://visjs.github.io/vis-network/examples/Echartshttps://echarts.apache.orgAntvG6https://www.yuque.com/antv/g6/intro
知识图谱开源工具:大规模图谱搜索工具
Elasticsearchhttps://www.elastic.co/cn/FAISShttps://github.com/facebookresearch/faissSPTAGhttps://github.com/microsoft/SPTAGVearchhttps://github.com/vearch/vearchMilvushttps://milvus.io/
人工智能
自然语言处理
更多相关内容
GitHub开源史上最大规模中文知识图谱
万次阅读
多人点赞
2019-10-2917:47:20
近日,一直致力于知识图谱研究的OwnThink平台在Github上开源了史上最大规模1.4亿中文知识图谱,其中数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式。
近日,一直致力于知识图谱研究的OwnThink平台在Github上开源了史上最大规模1.4亿中文知识图谱,其中数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式。
到目前为止,OwnThink项目开放了对话机器人、知识图谱、语义理解、自然语言处理工具。
知识图谱融合了两千五百多万的实体,拥有亿级别的实体属性关系,机器人采用了基于知识图谱的语义感知与理解,致力于最强认知大脑。
自然语言处理工具包的功能有:中文分词、词性标注、命名实体识别、关键词提取、文本摘要、新词发现、情感分析等。
在OwnThink平台首页上滚动着各种关键词,用户也可输入自己想要查询的知识,然后就可以得出相应的知识图谱。
OwnThink知识图谱还可以应用于机器人问答系统、知识推荐等等。
下图为知识图谱在机器人上的应用。
OwnThink支持在线API调用,感兴趣的小伙伴可以调测使用,使用Python进行对话机器人简单调用测试。
importjson
importrequests
sess=requests.get('https://api.ownthink.com/bot?spoken=中国')
answer=sess.text
answer=json.loads(answer)
print(answer)
效果如下:
GitHub地址:https://github.com/ownthink/KnowledgeGraphData
OwnThink网站地址:https://www.ownthink.com/
收起
展开全文
史上最大中文知识图谱,规模达1.4亿,现开源下载!
千次阅读
2019-10-2108:15:00
公众号关注“GitHubDaily”设为“星标”,每天带你逛GitHub!转自量子位,作者郭一璞最近,一份规模达1.4亿的知识图谱被开源了,而且还是中文。
开源贡...
公众号关注 “GitHubDaily”
设为“星标”,每天带你逛GitHub!
转自量子位,作者郭一璞
最近,一份规模达1.4亿的知识图谱被开源了,而且还是中文。
开源贡献者是一位个人开发者Yener,这也是目前已开源的最大规模的中文知识图谱。
你可以在下面这个网站上查看该知识图谱中的具体内容:
https://www.ownthink.com/
比如,我们输入“周杰伦”。
此时周杰伦的一些歌曲、电影、所获奖项就都出现了,还有他的出生地、星座、血型等个人信息。
点一下“七里香”,就会延伸到《七里香》这首歌的更多信息。
比如它的风格、发行地、唱片公司等,你还可以接着点,比如点“普通话”。
这里就出现了普通话的历史、来源、发源地等信息。
贡献者Yener在微博表示,该知识图谱是实时更新的,也就是说它的规模还可能会变得更大。
不过,它的实时更新也和数据的来源有关,比如我们输入“美元”这个词。
这时该知识图谱中显示的汇率并非当天汇率,而是和百度百科一致,因此该知识图谱中和百度百科一样,备注了汇率的更新时间。
另外,Yener的平台OwnThink上还有一个聊天机器人,一些知识图谱里包含的问题,机器人会给予解答。
不过有时候这只机器人还是挺调皮的,不一定每次都会告诉你答案是什么。
这只机器人已经开放了API接口,如果需要的话,你可以把他接到微信或者网页上。
GitHub:https://github.com/ownthink/KnowledgeGraphData
---
以上,便是今日分享,觉得不错,还请点个在看,谢谢~
推荐阅读:
霸榜GitHub,只用1MB,就能识别出你这张脸!
在对比了GitHub5000个Python项目之后,我们精选出了这36个!
GitHub标星2.7w+!超全大厂面试笔记整理!
「GitHub交流群」已开放
想入群的可在公众号后台回复「入群」
收起
展开全文
介绍一些知识图谱的实际应用类项目
千次阅读
2020-10-2610:05:00
目前已经有很多方法来构建知识图谱,在实际项目中,我们更加关注可以用构建好的知识图谱来干些什么,因此,我找到了网上一些对于当前知识图谱的应用的介绍,分享给大家。
...中文知识图谱OpenKG,CN-DB
目前已经有很多方法来构建知识图谱,在实际项目中,我们更加关注可以用构建好的知识图谱来干些什么,因此,我找到了网上一些对于当前知识图谱的应用的介绍,分享给大家。
1国内外知识图谱项目
国外:
常识知识库:Cyc、WordNet、ConceptNet等。
互联网知识图谱:主要有FreeBase、DBpedia、Schema、Wikidata、BableNet、MicrosofotConceptGraph,医疗领域LinkedLifeData等。
国内:
中文知识图谱OpenKG,CN-DBpedia,中医药知识图谱,阿里电商知识图谱、美团知识图谱、XLore(清华大学)、Belief-Eigen(中科院)、PKUPie(北京大学)等。
开放类的中文百科知识图谱http://zhishi.me等。
2最新的知识图谱搜索引擎Magi
Magi是由
PeakLabs研发的基于机器学习的信息抽取和检索系统,它能将任何领域的自然语言文本中的知识提取成结构化的数据,通过终身学习持续聚合和纠错,进而为人类用户和其他人工智能提供
可解析、
可检索、
可溯源的知识体系。
3应用场景和应用实例
应用场景:语义搜索、问答系统、智能决策等。
应用实例:百度知识图谱、watson问答系统、金融知识图谱包括信贷审查、金融反欺诈、中医药知识图谱、学术知识图谱清华的Aminer、唐诗知识图谱、知识图谱辅助情报研判、军事图谱辅助作战指挥等。
4中文知识图谱资源库
OpenKG包含16类的知识图谱,同时包括56个知识图谱相关工具,此外经常发布知识图谱论文解读。
OpenKG是中国中文信息学会语言与知识计算专业委员会所倡导,由来自浙江大学、东南大学、同济大学等多个单位的知识图谱团队共同维护的开放知识图谱社区项目。
OpenKG目前主要包含三个子项目,由OpenKG工作组总体协调开展工作:
OpenKG开放资源共享平台:http://OpenKG.CN中文开放知识图谱Schema:http://cnSchema.org中文开放知识图谱众包平台:Openbase
OpenKG的官网链接:www.openkg.cn
5明略科技HAO图谱OpenAPI
明略科技HAO图谱,作为目前世界上第一个语音实时生成图谱的企业级知识图谱开发工具包。
HAO图谱,源自于2018年明略科技提出的HAO智能理论框架。
HAO智能旨在集成人类智能(HI)、人工智能(AI)和组织智能(OI),打通感知、认知和行动系统,帮助企业和组织实现智能化发展。
其中,HAO图谱属于认知系统的范畴。
HAO图谱,可以独立运行,也可交付给企业技术团队进行二次开发,核心模块包括语音流监听,语音转文本,标点预测,口语顺滑,文本补全,实体关系抽取,实体对齐,以及图谱话题切换。
6Github上的一些优秀的知识图谱项目
Github上开源了很多有关知识图谱的项目,经过调研,整理了一些优秀的知识图谱项目。
1.利用网络上公开的数据构建一个小型的证券知识图谱/知识库
https://github.com/lemonhu/stock-knowledge-graph
2.医疗保险领域知识图谱
https://github.com/AdiaLoveTrance/MedicalInsuranceKG
3.农业知识图谱(AgriKG):农业领域的信息检索,命名实体识别,关系抽取,智能问答,辅助决策
https://github.com/qq547276542/Agriculture_KnowledgeGraph
4.漫威英雄的知识图谱
https://github.com/YZHANG1270/Marvel_KnowledgeGraph
5.基于知识图谱的《红楼梦》人物关系可视化及问答系统
https://github.com/chizhu/KGQA_HLM
6.小型金融知识图谱构建流程
https://github.com/jm199504/Financial-Knowledge-Graphs
7.中式菜谱知识图谱可视化(CookBook-KG)
https://github.com/ngl567/CookBook-KG
8.从无到有构建一个电影知识图谱,并基于该KG,开发一个简易的KBQA程序
https://github.com/SimmerChan/KG-demo-for-movie
9.上市公司高管图谱
https://github.com/Shuang0420/knowledge_graph_demo
10.红楼梦人物关系图谱
https://github.com/chizhu/KGQA_HLM
11.通用领域知识图谱
https://github.com/Pelhans/Z_knowledge_graph
12.免费1.5亿实体通用领域知识图谱
https://github.com/ownthink/KnowledgeGraph
往期精选:
手把手教你搭建一个中式菜谱知识图谱可视化系统
斯坦福大学CS520知识图谱系列课程学习笔记:第三讲高级的知识图谱是什么样的
置顶删除斯坦福大学CS520知识图谱系列课程学习笔记:第二讲如何构建知识图谱
斯坦福大学CS520知识图谱系列课程学习笔记:第一讲什么是知识图谱
知识图谱最新权威综述论文解读:知识表示学习部分
如果对文章感兴趣欢迎关注知乎专栏“人工智能遇上知识图谱“,也欢迎关注同名微信公众号“人工智能遇上知识图谱”,让我们一起学习并交流讨论人工智能与知识图谱技术。
收起
展开全文
人工智能
自然语言处理
中文人物关系知识图谱项目,内容包括中文人物关系图谱构建-python
2021-06-1820:53:41
中文人物关系知识图谱项目,内容包括中文人物关系图谱构建,基于知识库的数据回标,基于远程监督与bootstrapping方法的人物关系抽取,基于知识图谱的知识问答等应用.
收起
自然语言处理
知识图谱构建实验笔记(二):知识图谱搭建过程与总结
千次阅读
2022-03-1915:05:32
本篇记上篇原理后对整个构建知识图谱的过程进行一个比较系统的实践过程。
同样,实验代码记录自实验楼的射雕英雄传,根据个人习惯与理解程度,进行了重新排版与修改,实验过程与结果在个人腾讯云上完成。
命名实体...
收起
自然语言处理
python
中文文本生成知识图谱
千次阅读
2021-09-0211:28:25
将提供中文分词、词性标注、命名实体识别、情感分析、知识图谱关系抽取、关键词抽取、文本摘要、新词发现、情感分析、文本聚类等常用自然语言处理功能。
Jiagu详细内容参考:https://github.com/ownthink/Jiagu1.2...
收起
自然语言处理
机器学习
知识图谱实战例子
2021-10-1921:10:49
当时上知识图谱课程,整理的几个有关知识图谱的实战例子。
1.知识图谱简介相关这是一份通俗易懂的知识图谱...[Github]知识图谱的应用示例基于知识图谱的问答系统(KBQA)KBQA简单讲就是将问题带入提前准备好的知识.
收起
python
手把手教你搭建一个中式菜谱知识图谱可视化系统
千次阅读
多人点赞
2020-05-1715:17:13
手把手教你搭建一个中式菜谱知识图谱可视化系统中式菜谱知识图谱中式菜谱知识图谱今天分享一个自己从数据爬取到d3可视化的中式菜谱知识图谱可视化系统的搭建流程。
Github项目地址:...
收起
自然语言处理
知识图谱|阿里小蜜多模态知识图谱的构建及应用
2021-12-2101:00:34
每天给你送来NLP技术干货!作者|徐国海@阿里巴巴来源|DataFunTalk导读:本文由阿里巴巴达摩院阿里小蜜团队带来,介绍其在知识图谱方面一年多以来的一些工作进展。
主要内容包...
收起
算法
大数据
自然语言处理
编程语言
机器学习
知识图谱一--知识图谱架构、DeepDive中文抽取示例
万次阅读
2019-03-1015:10:25
目前知识图谱大多采用自底向上的方式构建,本文也主要介绍自底向上的知识图谱构建技术,按照知识获取的过程分为3个层次:信息抽取、知识融合以及知识加工。
2.1知识图谱的构建技术采用自底向上的方式构建...
收起
DeepDive
CMeKG代码解读(以项目为导向从零开始学习知识图谱)(一)
2022-02-0609:33:15
作者从零开始学习和知识图谱有关技术和内容,而本文的核心内容是对...CMeKG(ChineseMedicalKnowledgeGraph)是利用自然语言处理与文本挖掘技术,基于大规模医学文本数据,以人机结合的方式研发的中文医学知识图谱。
收起
python
GitHub-FreeFlyXiaoMa/knowledge_graph_demo_:一个知识图谱的练习demo
2020-12-2900:24:14
QABasedOnKnowledgeGraphself-implementofstock...从无到有搭建一个以股票为中心的一定规模金融领域知识图谱,并以该知识图谱完成自动问答与分析服务。
项目介绍基于问财网站数据的金融知识图谱构建基于金融知识...
收起
【知识图谱】知识图谱存储、查询、可视化
2021-08-0712:09:59
【知识图谱】Neo4j的基本使用及思知1.4亿三元组数据构建知识图谱https://blog.csdn.net/NIeson2012/article/details/102785086非常非常非常详细,使用Neo4j的import导入biggraph。
使用neo4j创建数据库以及导入...
收起
python
人工智能
300行python代码从零开始构建基于知识图谱的电影问答系统3-实验环境和实验数据准备
万次阅读
多人点赞
2019-05-0620:56:39
,读了这篇文章,相信你对知识图谱有了一个初步的印象,其实质就是利用三元组来表示实体的一些信息,而关于这些信息的存储,一种是基于RDF的存储;另一种是基于图数据库的存储。
而本项目采用的是图数据库存储,主要...
收起
neo4j
智能问答系统
基于知识图谱推荐系统
万次阅读
多人点赞
2020-04-1517:52:49
CKE在电影推荐和图书推荐上取得了很高的Recall值和MAP值:RippleNetworkRipple的中文翻译为“水波”,顾名思义,RippleNetwork模拟了用户兴趣在知识图谱上的传播过程,整个过程类似于水波的传播:一个用户的...
收起
知识图谱—jieba、pyhanlp、smoothnlp工具实现中文分词(词性表)
千次阅读
2021-12-3010:23:17
最近也是在预研知识图谱相关技术。
这里面涉及到了一些关于自然语言处理方面的内容和技术。
目前已经调研了一些分词、命名体识别相关技术。
今天记录下分词工具的使用。
一、什么是知识图谱?笔者理解的知识图谱是...
收起
自然语言处理
知识图谱商业应用、介绍
2019-12-1714:33:15
文章目录...05OpenKG.CN——开放的中文知识图谱06楚辞07海致大数据08腾讯云星图09网感至察10慧科技术-商业AI(NLP+品牌Logo识别)二、相关科研机构与算法框架2.1复旦大学Knowle...
收起
nlp
OpenKG开源系列|开源知识图谱融合工具OpenEA(南京大学)
千次阅读
2021-08-0200:06:48
OpenKG地址:http://openkg.cn/tool/openeaGitHub地址:https://github.com/openkg-org/OpenEAGitee地址:http...
收起
算法
人工智能
python
机器学习
大数据
liuhuanyong.github.io:面向中文自然语言处理的六十余类实践项目及学习索引,涵盖语言资源构建、社会计算、...
2021-08-0411:18:50
面向中文自然语言处理的六十余类实践项目及学习资源,涵盖语言资源构建、社会计算、自然语言处理组件、知识图谱、事理图谱、知识抽取、情感分析、深度学习等几个学习主题。
包括作者个人简介、学习心得、语言资源、...
收起
CSS
新书速递|《知识图谱:方法、实践与应用》
千次阅读
2019-10-1821:31:26
本文转载自公众号:博文视点Broadview。
互联网促成了大数据的集聚,大数据进而促进了人工智能算法的进步。
近年来知识图谱作为AI领域底层技术被越来越多的人谈起。
知识图...
收起
知识图谱构建(概念,工具,实例调研)
万次阅读
多人点赞
2020-10-2412:56:41
知识图谱构建一、知识图谱的概念知识图谱(Knowledgegraph)知识图谱是一种用图模型来描述知识和建模世界万物之间的关联关系的技术方法。
知识图谱由节点和边组成。
节点可以是实体,如一个人、一本书等,或是...
收起
知识图谱架构(KnowledgeGraph)
万次阅读
多人点赞
2020-04-0716:10:57
本文以通俗易懂的方式来讲解知识图谱相关的知识、尤其对从零开始搭建知识图谱过程当中需要经历的步骤以及每个阶段需要考虑的问题都给予了比较详细的解释。
知识图谱(KnowledgeGraph)的概念由谷歌2012年正式...
收起
知识图谱-实体识别
千次阅读
2022-03-1912:34:01
知识图谱中实体识别相关内容
收起
人工智能
大规模1.4亿中文知识图谱数据ownthink开源了
千次阅读
2020-10-2722:05:28
本次ownthink开源了史上最大规模的中文知识图谱,数据是以(实体、属性、值),(实体、关系、实体)混合的形式组织,数据格式采用csv格式,下载链接见文末。
解压后查看知识图谱规模:$wc-lownthink_v2....
收起
生物医学知识库/知识图谱(英文+中文)盘点
千次阅读
2020-01-2411:19:04
因为硕士研究方向是基于知识图谱的医学问答系统,所以调研了下现有的生物医学(BioMedical)和医学(Medical)知识库。
首先需要对上述两个概念做个区分,从我的理解来看,生物医学更加微观,偏向于蛋白质/基因等各种...
收起
自然语言处理
【知识图谱】Neo4j的基本使用及思知1.4亿三元组数据构建知识图谱
万次阅读
多人点赞
2019-10-2817:28:18
重点介绍了目前国内最大的开源中文知识图谱ownthink,如何将ownthink的三元组源数据制作成一个知识图谱供大家使用,希望大家站在巨人的肩膀之上,构建自己的知识图谱,同时贡献一份自己的力量。
ownthink知识图谱...
收起
Neo4j的使用
如何构建知识图谱和问答系统
千次阅读
2022-02-2213:30:39
前言问答系统是NLP在业界最为重要的落地场景之一,但由于其全链路比较复杂,学习的时候难以入手。
...ps:之前断断续续写了知识图谱和问答系统的构建,干脆整合成一个完整的github项目,并对知识图谱进行系统性介绍。
收起
人工智能
问答系统
neo4j
[Python知识图谱]四.Python和Gephi实现中国知网合作关系知识图谱
万次阅读
多人点赞
2019-09-0216:47:35
该系列文章主要讲解知识图谱或关系图谱的构建方法,前文介绍了Neo4j图数据库和Jieba、PyLTP的基本用法。
本篇文章主要采用Python和Gephi构建中国知网某个领域的作者合作关系和主题词共现的知识图谱,重点阐述了一种可...
收起
Python
关系图谱
中国知网
知识图谱+Recorder︱中文知识图谱API与工具、科研机构与算法框架
千次阅读
2019-01-2910:18:13
文章目录 @[toc] 一、知识图谱商业应用... 01唯品金融大数据... 05OpenKG.CN——开放的中文知识图谱 06楚辞 07海致大数据 08腾讯云星图 09网感至察 10慧科技术-商业AI(NLP...
收起
空空如也
空空如也
1
2
3
4
5
...
20
收藏数
3,190
精华内容
1,276
热门标签
github官网进不去
github怎么用
github加速
github打不开
github使用教程图文详解
github下载
github开源项目
github镜像
github使用
相关推荐
ruijin_round1:瑞金医院MMC人工智能辅助建立知识图谱大赛初赛
瑞金医院MMC人工智能辅助内置知识图谱大赛(第一赛季):warning:由于可能存在的版权问题,请自行联系大赛主办方索要数据,在问题中索要数据的请求将不再回复,谢谢!:li
jiagu:jiagu深度学习自然语言处理工具知识图谱关系抽取中文分词词性标注命名实体识别情感分析新词发现
将提供中文分词,词性标注,命名实体识别,情感分析,知识图谱关系转移,关键字检索,文本摘要,新词发现,情感分析,文本聚类等常用自然语言处理功能。
参考了各大工具优缺点制
PythonNeo4j医药知识图谱自动问答系统源码.zip
Python+Neo4j医药知识图谱自动问答系统源码,知识图谱构建,自动问答,基于kg的自动问答。
以疾病为中心的一定规模医药领域知识图谱,并以该<
NLP_resorce_pool:整理NLP相关学习资料,提供系统化的学习路径
知识图谱:1)实体链接2)知识推理3)本体提取4)多模态知识图谱5)实体分类[NET]6)知识图谱/知识库[各种常识文献
java8集合源码-github-bookMark:github-bookMark
收集了Github上看到的各种不同的优秀工具,框架,知识合集Web框架-Java语言的极速WEB+ORM框架,其核心设计目标是开发Swift、代码量
关键字:github中文知识图谱
延伸文章資訊
- 1GitHub开源史上最大规模中文知识图谱 - 阿里云开发者社区
近日,一直致力于知识图谱研究的OwnThink 平台在Github 上开源了史上最大规模1.4 亿中文知识图谱,其中数据是以(实体、属性、值),(实体、关系、 ...
- 2github 中文知识图谱 - CSDN
近日,一直致力于知识图谱研究的OwnThink 平台在Github 上开源了史上最大规模1.4 亿中文知识图谱,其中数据是以(实体、属性、值),(实体、关系、实体)混合的形式 ...
- 3GitHub开源史上最大规模中文知识图谱 - 51CTO博客
近日,一直致力于知识图谱研究的OwnThink 平台在Github 上开源了史上最大规模1.4 亿中文知识图谱,其中数据是以(实体、属性、值),(实体、关系、 ...
- 4Github六个知识图谱实战项目推荐 - 网易
他在Github维护了知识图谱项目,非常值得学习! 1. 知识图谱构建,自动问答,基于kg的自动问答。以疾病为中心的一定规模医药领域知识图谱,并 ...
- 5husthuke/awesome-knowledge-graph: 整理知识图谱相关学习 ...
整理知识图谱相关学习资料. Contribute to husthuke/awesome-knowledge-graph development by creating an account o...