lihanghang/NLP-Knowledge-Graph: 自然语言处理、知识图谱
文章推薦指數: 80 %
自然语言处理、知识图谱、对话系统三大技术研究与应用。
. Contribute to lihanghang/NLP-Knowledge-Graph development by creating an account on GitHub.
Skiptocontent
{{message}}
lihanghang
/
NLP-Knowledge-Graph
Public
Notifications
Fork
324
Star
1.2k
自然语言处理、知识图谱、对话系统三大技术研究与应用。
License
MITlicense
1.2k
stars
324
forks
Star
Notifications
Code
Issues
0
Pullrequests
0
Actions
Projects
0
Wiki
Security
Insights
More
Code
Issues
Pullrequests
Actions
Projects
Wiki
Security
Insights
lihanghang/NLP-Knowledge-Graph
Thiscommitdoesnotbelongtoanybranchonthisrepository,andmaybelongtoaforkoutsideoftherepository.
master
Branches
Tags
Couldnotloadbranches
Nothingtoshow
{{refName}}
default
Couldnotloadtags
Nothingtoshow
{{refName}}
default
2
branches
0
tags
Code
Latestcommit
Gitstats
165
commits
Files
Permalink
Failedtoloadlatestcommitinformation.
Type
Name
Latestcommitmessage
Committime
.github
【拓展】认知科学
中文金融文档抽取/paper
事理图谱
基于知识图谱的对话系统
数据集/text-similarity
知识图谱基础
知识图谱技术总结
知识存储
知识库构建
自然语言处理
语义计算
.gitignore
.travis.yml
LICENSE
README.md
WechatIMG1.png
Viewcode
DeeplearningforKnowledge-Graph
项目外链
知识图谱的前世今生
研究总结列表
专题研究
KG&QA相关理论解析
NLP相关论文解析
中文金融文档结构化研究
知识图谱相关会议
事理图谱
对话系统技术
关于NLP/对话/KG的商业化相关(仅供交流学习)
主流开源的问答&&对话系统列表
主流语义平台列表
中英文文本预处理工具列表
图存储与查询工具
可视化工具
中英文知识图谱数据集列表
比赛
思考
说明
Contact
README.md
有需要为该开源项目贡献的小伙伴可以联系我哟。
DeeplearningforKnowledge-Graph
项目外链
知识图谱的前世今生
研究总结列表
专题研究
KG&QA相关理论解析
NLP相关论文解析
中文金融文档结构化研究
知识图谱相关会议
事理图谱
对话系统技术
关于NLP/对话/KG的商业化相关(仅供交流学习)
主流开源的问答&&对话系统列表
主流语义平台列表
中英文文本预处理工具列表
图存储与查询工具
可视化工具
中英文知识图谱数据集列表
比赛
思考
说明
Contact
DeeplearningforKnowledge-Graph
探索认知智能系列---趋势:数据融合知识
包括知识获取、知识库构建、基于知识库的问答系统系列技术研究与应用
项目外链
NLP-Progress
RepositorytotracktheprogressinNaturalLanguageProcessing(NLP),includingthedatasetsandthecurrentstate-of-the-artforthemostcommonNLPtasks.
技术栈在线文档
知识图谱的前世今生
序号
文章
1
为什么要将「知识图谱」追溯到1956年?
研究总结列表
专题研究
基于知识图谱的对话系统
KG&QA相关理论解析
知识图谱综述
知识图谱的挑战
深度学习与知识图谱
CN-DBpedia:ANever-EndingChineseKnowledgeExtractionSystem
KBQA
赵汀阳:人工智能的自我意识何以可能?1-3
NLPUniversity开张大吉--李维老师,SimonFraserUniversity,博士
ACL2019知识图谱的全方位总结
NLP相关论文解析
TheIllustratedTransformer
AnAttentiveSurveyofAttentionModels
BERT:BidirectionalEncoderRepresentationsfromTransformers
ERNIE:EnhancedRepresentationthroughKnowledgeIntegration
ERNIE:EnhancedLanguageRepresentationwithInformativeEntities
GoogleT5:Text-To-TextTransferTransformer
中文金融文档结构化研究
Doc2EDAG
知识图谱相关会议
编号
名称
等级
类型
领域
1
ACL
A类
学术会议
人工智能
2
CVPR
A类
学术会议
人工智能
3
ICML
A类
学术会议
人工智能
4
IJCAI
A类
学术会议
人工智能
5
EMNLP
B类
学术会议
人工智能
6
CIKM
B类
学术会议
数据库/数据挖掘/内容检索
7
AAAI
A类
学术会议
人工智能
8
SIGKDD
A类
学术会议
数据库/数据挖掘/内容检索
9
TKDE
A类
学术期刊
(数据库/数据挖掘/内容检索)
10
SIGIR
A类
学术会议
数据库/数据挖掘/内容检索
事理图谱
事理图谱综述
白硕:事理图谱六问六答
对话系统技术
CSDN|公开课笔记:一文详解启发式对话中的知识管理_aispeech
对话系统综述
对话系统中的口语理解技术(SLU)
关于NLP/对话/KG的商业化相关(仅供交流学习)
语音交互中的自然语言处理技术--xiaomi
精益知识图谱方法论--文因互联
小i机器人在中文语义开放平台的研究与进展--小i机器人
科大讯飞-从应用角度来看知识图谱的价值和挑战--科大讯飞
主流开源的问答&&对话系统列表
编号
名称
地址
1
questionAnsweringsystem
QuestionAnsweringSystem是一个Java实现的人机问答系统,能够自动分析问题并给出候选答案。
2
QABasedOnMedicaKnowledgeGraph
从无到有搭建一个以疾病为中心的一定规模医药领域知识图谱,并以该知识图谱完成自动问答与分析服务。
python
3
DeepPavlov
Anopensourcelibraryfordeeplearningend-to-enddialogsystemsandchatbots.python
主流语义平台列表
编号
名称
1
腾讯文智中文语义平台
2
科大讯飞开放语义平台
3
玻森中文语义开放平台
4
哈工大语言云
中英文文本预处理工具列表
编号
名称
主要功能
1
THULAC
中文词法分析工具,支持C++/JAVA/Pythonby清华
2
LTP
语言技术平台pylypLTP的Python封装by哈工大
3
HanLP
支持Java
4
结巴分词
中文分词(仅支持分词),Java、python、C++
5
jiagu
提供中文分词、词性标注、命名实体识别、关键词抽取、文本摘要、新词发现等常用自然语言处理功能。
Python
6
fudanNLP
中文分词(分词、词性标注、命名实体识别),支持Java
7
deepdive
斯坦福大学的开源知识抽取工具(三元组抽取),支持python
8
FudanDNN-NLP3.0
用于中文分词、命名识别、词性标注、句子分类、语义分析、知识库访问、对话问答,支持Java----复旦大学计算机学院机器人研究实验室所开发的基于深度学习的中文自然语言处理工具
9
StanfordCoreNLP
可进行多语言的词性标注器、命名实体的识别器、解析器(句子与语法结构)、指代消解器(就是在篇章中确定代词指向哪个名词短语的问题)、情感分析器、引导模式学习器、开放信息提取器,Java/Python-----StanfordCoreNLP是斯坦福大学的自然语言处理工具包,工具包需要java的支持
图存储与查询工具
编号
名称
主要功能
1
Neo4j
开源图形数据库,由Java开发。
2
OrientDB
开源的noSQL数据库,可处理文档、图形、传统数据库组件。
由Java编写,存储速度快。
3
Virtuoso
支持RDF与SPARQL查询。
4
Titan
可与Gremlin/Hbase进行集成,可实现分布式存储和计算的图数据处理。
5
ApacheJena-IDB
在JAVA下操作RDF。
其中TDB是使用triplestore的形式对RDF数据提供持久性存储(persistentstore),TDB相比RDB、SDB更快且具有扩展性。
6
Cypher
声明式图查询语言,表达高效查询和更新图数据库。
7
Gremlin
一种函数式数据流语言,可以使得用户使用简洁的方式表述复杂的属性图(propertygraph)的遍历或查询。
8
SPARQL
为RDF开发的一种查询语言和数据获取协议。
9
rdflib
基于Python语言编写的,RDF/XML,N3,NTriples,N-Quads,Turtle,TriX,RDFa和Microdata的解析器和序列化器,支持SPARQL1.1查询和更新语句。
可视化工具
编号
名称
主要功能
1
ECharts
百度开源工具,API封装完善,简单好用,易上手,但不支持事件处理。
2
Cytoscape.js
针对图形和网络,事件交互性的支持不错,同样易上手。
3
D3.js
使用门槛较高,但支持事件处理器,D3的开销极小,支持大型数据集和交互动画的动态行为,支持图形丰富。
中英文知识图谱数据集列表
编号
名称
应用任务
1
OpenKG
开放知识图谱
2
CN-Probase
大规模中文概念图谱
3
SentiBridge
中文实体情感知识库,刻画人们如何描述某个实体,包含新闻、旅游、餐饮,共计30万对
4
音乐知识图谱
中文音乐知识图谱,歌手、歌曲等信息
5
人物类RDF知识
采集自百科网站的人物类知识,共65万个RDF三元组
6
中国旅游景点知识图谱
中国旅游景点中文知识图谱是CASIA-KB知识图谱的一部分。
抽取自百度百科和互动百科。
旅游景点知识图谱可用于地理、生活、娱乐等应用。
7
200万条商品画像数据
本数据是百分点在7年运营过程中积累的产品画像数据的小结,百分点自建了丰富的电商品分类体系和媒体分类体系。
8
中文症状库
这是一个包含症状实体和症状相关三元组的数据集。
中文症状库的数据来自8个主流的健康咨询网站、3个中文百科网站和电子病历。
9
cnSchema机场知识图谱
基于cnSchema的机场知识图谱可查询世界各机场的属性,包含名称、时区、机场代码、地理位置(经纬度)等。
10
七律-通用知识图谱
本数据共包含8000万条百科三元组,为七律的一部分子集,后续将持续加大开放。
七律-7Lore,是狗尾草科技精心打造的百科知识图谱,是人类世界海量知识的集合,它包含了事物、事实、概念、规则等等。
比赛
ATEC蚂蚁开发者大赛之学习赛--NLP之问题相似度计算--2019-3
百度2019语言与智能技术竞赛之第二赛道--知识驱动对话--2019-4
SMP2019中文人机对话技术评测(ECDT),子任务:领域分类、意图识别和语义槽填充--Task1:自然语言理解评测--2019-5
思考
知识图谱的构建是一个体系化的工程项目,目前结合深度学习技术以及自然语言处理知识在一定程度上提升了构建的效率并降低了成本。
知识图谱的地位在认知智能是一个基础资源设施,基于此可以进行问答、对话、、推荐系统、可解释性的增强等方面的应用。
目前对于垂直领域的知识图谱构建需求较多。
应用方面在智能问答和主动式对话系统的实践是比较热点的方向。
个人觉得一套爬虫系统可以为知识库提供动态更新的知识来源。
结合知识/常识的对话系统,更具准确性和多样性,是一个值得研究的方向,可让机器引导用户进行话题的交流。
如上面比赛2就是这一方向的应用。
自然语言处理/理解目前门槛已经高升到了BERT啦,在绝大数任务中基本都是必提的,基于Transformer做编码器!如何在模型训练中融入知识(可以是多模态)已是目前研究的热点方向,如百度最近提出的ERNIE表示模型就引入这一思想,也在下游任务中取得了不错的效果。
知识图谱的表示研究问题(KnowledgeGraphEmbedding,KGE)是当前的一个研究热点。
多模态数据知识融合应该是领域性机器智能走向通用知识智能的一个重要探索阶段。
一是,由于多模态数据自身特点,结构化是非常重要的,结构化后可以极大丰富知识图谱的知识构成,更具丰富的表达。
二是,CV、NLP组件化后的若能打通两者并协同工作感觉也比较有意思,比如问答场景的回复内容更丰富,和人们更加自然交流等。
针对文本数据的结构化,除了选用机器学习方法外,也可以结合正则表达式进行数据的抽取、模型建模的中间处理环节等。
如:正则表达式结合深度学习
说明
以上内容均为个人在学习过程的相关整理(包含互联网内容、个人整理笔记等),希望对研究学习认知智能领域的小伙伴有帮助。
Contact
CSDN
个人网站
wiki-技术总结
邮箱:[email protected]
Updatedon116,2021.
Authoer:LiHangHangBeijing
About
自然语言处理、知识图谱、对话系统三大技术研究与应用。
Topics
nlp
machine-learning
deep-learning
transformers
knowledge-graph
event-driven
ner
bert
kbqa
ernie
Resources
Readme
License
MITlicense
Stars
1.2k
stars
Watchers
59
watching
Forks
324
forks
Releases
Noreleasespublished
Sponsorthisproject
https://github.com/lihanghang/Knowledge-Graph/blob/master/WechatIMG1.png
Packages0
Nopackagespublished
Contributors3
Youcan’tperformthatactionatthistime.
Yousignedinwithanothertaborwindow.Reloadtorefreshyoursession.
Yousignedoutinanothertaborwindow.Reloadtorefreshyoursession.
延伸文章資訊
- 1老刘说NLP:这几年的NLP历程回顾,以及关于NLP(知识图谱 ...
这份经历是很有收益的,因为成为了不少NLP学习爱好者入门的一个很好的索引。 在这里插入图片描述 在这个项目集合中,细分了语言资源、语言工具、知识图谱资源、情感计算、 ...
- 2知識圖譜的初探-(一) - Medium
最近開始聽聞很多做AI,NLP領域的人開始接觸知識圖譜了,我大概從一兩年前發現這個東西,也是還在學習,希望做一些分享和交流與回饋。. “知識圖譜的 ...
- 3知識圖譜建構- NLP 關係抽取方法| 開箱#第一線資料科學工作者 ...
這一場活動我們邀請目前在國泰金控數位數據暨科技發展中心擔任資料科學分析師的 鈞宜(Abao)分享「知識圖譜建構- NLP 關係抽取方法」主題,從知識圖譜的組件與關係 ...
- 4一文打尽知识图谱(超级干货,建议收藏!) - NLP论文解读
原创作者 | 朱林01 序言知识是人类在实践中认识客观世界的结晶。知识图谱(Knowledge Graph, KG)是知识工程的重要分支之一,它以符号形式结构化地 ...
- 5lihanghang/NLP-Knowledge-Graph: 自然语言处理、知识图谱
自然语言处理、知识图谱、对话系统三大技术研究与应用。. Contribute to lihanghang/NLP-Knowledge-Graph development by creating ...