知识图谱概念与技术pdf_论文浅尝| 区分概念和实例的知识图谱嵌入 ...

文章推薦指數: 80 %
投票人數:10人

链接:https://arxiv.org/pdf/1811.04588.pdf知识图谱的表示学习最近几年被广泛研究,表示学习的结果对知识图谱补全和信息抽取都有很大帮助。

本文提出了一种新的区分 ... 知识图谱概念与技术pdf_论文浅尝|区分概念和实例的知识图谱嵌入方法_weixin_39747511的博客-程序员资料 技术标签: 知识图谱概念与技术pdf   链接:https://arxiv.org/pdf/1811.04588.pdf 知识图谱的表示学习最近几年被广泛研究,表示学习的结果对知识图谱补全和信息抽取都有很大帮助。

本文提出了一种新的区分概念和实例的知识图谱表示学习方法,将上下位关系与普通的关系做了区分,可以很好的解决上下位关系的传递性问题,并且能够表示概念在空间中的层次与包含关系。

本文的主要贡献有三点:(1)第一次提出并形式化了知识图谱嵌入过程中概念与实例区分的问题。

(2)提出了一个新的嵌入模型TransC模型,该模型区分了概念与实例,并能处理isA关系的传递性。

(3)基于YAGO新建了一个用于评估的数据集。

Background 传统的表示学习方法没能区分概念(concept)和实例(instance)之间的区别,而是多数统一看作实体(entity),而概念显然和实例不是同一个层次的,统一的表示是有欠缺的。

更重要的是,之前的方法多数无法解决上下位关系传递性的问题,这是不区分概念和实例表示的弊端。

本文创造性的将概念表示为空间中的一个球体,实例为空间中的点,通过点和球体的空间包含关系和球体间的包含关系来表示上下位关系,这种表示可以很自然地解决上下位关系传递性的问题。

下图是一个区分了概念,实例的层次关系图。

Model 通常在人们的脑海里,概念都是通过层级的方式组织起来的,而实例也应归属于与它们各自对应的概念,受此启发,本文提出了TransC模型来处理概念和实例区分的问题。

在TransC模型里,每一个概念都被表示成一个球体,而每一个实例都被表示到与对应概念相同的语义空间中。

概念与实例以及概念与概念之间的相对位置分别通过instanceOf关系与subClassOf关系来刻画。

InstanceOf关系用来表示某个实例是否在概念所表示的球体中,subClassOf关系用来表示两个概念之间的相对位置,文中提出了四种可能的相对位置: 图1 如图1所示,(a)、(b)、(c)、(d)分别表示两个概念所表示球体的相对位置,其中m为球体半径,d为两个球体中心的距离,Si与Sj分别表示概念i与概念j所表示成的球体。

对于instanceOf关系与subClassOf关系,文中有比较巧妙的设计以便保留isA关系的传递性,即instanceOf-subClassOf的传递性通过来体现,而subClassOf-subClassOf的传递性通过来体现,其中(i,r_e,c)表示InstanceOf三元组,(c_i,r_c,c_j)表示SubClassOf三元组。

文中设计了不同的损失函数去度量embedding空间中的相对位置,然后用基于翻译的模型将概念,实例以及关系联合起来进行学习。

在文中主要有三类triple,所以分别定义了不同的损失函数。

   InstanceOfTriple表示:对于一个给定的instanceOftriple,如果它是正确的,那么i就应该被包含在概念c所表示的球体s里。

而实际上,除了被包含以外,很显然还有一种相对位置就是实例i在球体s(P,m)之外,损失函数设计为:    SubClassOfTriple表示:对于一个给定的subClassOftriple(c_i,r_c,c_j),首先定义两个球中心之间的距离:按照图1所示的四种关系,还有另外三种损失函数需要定义。

(1)按照图1中(b)表示的相对位置,两个球是分开的,损失函数表示为:(2)两个球相交,如图1中(c)所示,损失函数表示为,与(1)类似。

(3)完全包含关系,如图1中(d)所示,损失函数表示为:(减小mj,增大mi)    RelationalTriple表示:对于一个relationaltriple(h,r,t),TransC利用TransE模型的训练方式来得到实体和关系的向量,所以损失函数定义为:    对于模型的训练,分别用和来表示正确和错误的三元组,根据以上几类损失函数,可以对应得到以下几类损失: 对于instanceOftriples,损失表示为,对于subClassOftriples,损失表示为,对于relationaltriples,损失表示为,最后,模型的最终损失函数为以上几类损失的线性组合,即。

Experiment 以往的大多数模型都用FB15K和WN18来作为评估的数据集,但这两个数据集并不很适合文中的模型,而YAGO数据集不仅含了许多概念而且还有不少实例,所以作者构建了一个YAGO数据集的子集YAGO39K来用作试验评估。

实验分别在链接预测,三元组分类以及instanceOf与subClassOf关系的三元组分类这几项任务上进行,实验结果如下:   链接预测与三元组分类结果: instanceOftriple分类结果: subClassOftriple分类结果: 实验结果表明,TransC模型在相关任务上与其它模型相比有较为显著的提升。

Conclusion 本文从Ontology层面对知识表示学习进行了较为深入的研究,提出了新的知识图谱嵌入模型TransC模型,该模型将实例、概念以及关系嵌入到同一个空间中以便用来处理isA关系的传递性。

在实验部分,作者还创建了一个用来评估模型的新数据集YAGO39K。

实验结果表明TransC模型在大多数任务上要优于传统的翻译模型。

对于文中将概念表示成球体的想法似乎还可以继续探讨,作者将会继续寻找适合表示概念的方式。

另外,每个概念在不同的三元组里可能会有不同的表示,如何进一步地将概念的多意性表达出来也是一个值得探究的方向。

在传统的知识工程领域,知识是通过schema组织起来的,有较强的逻辑性,但在语义计算层面相比向量来说没有优势,最近有不少将二者相结合的工作(给语义的向量计算披上逻辑的外衣)值得关注一下。

论文笔记整理:张良,东南大学博士,研究方向为知识图谱,自然语言处理。

OpenKG.CN 中文开放知识图谱(简称OpenKG.CN)旨在促进中文知识图谱数据的开放与互联,促进知识图谱和语义技术的普及和广泛应用。

点击阅读原文,进入OpenKG博客。

版权声明:本文为博主原创文章,遵循CC4.0BY-SA版权协议,转载请附上原文出处链接和本声明。

本文链接:https://blog.csdn.net/weixin_39747511/article/details/109997065 原作者删帖   不实内容删帖   广告或垃圾文章投诉 智能推荐 在执行初始化Mysql数据库时出现下列错误[[email protected]]#./mysql_install_db--user=mysql--datadir=/var/lib/mysql--socket=/var/lib/mysql/mysql.sock--pid-file=/var/run/mysqld/mysqld.pid--log-error=/v... 水题就要任性地用很水的方法来解~大体题意:给定一个target、一个由大写字母组成的字符串,从中任选5个,设为v,w,x,y,z,求满足v-w^2+x^3-y^4+z^5=target的5个字符,可能多解,输出字典序最大解,无解输出“nosolution”ProblemDescription:===Optechbriefing,2002/11/0206:42CST==... importcom.google.common.base.Joiner;importcom.google.common.base.Splitter;importcom.google.common.collect.Lists;importcom.google.common.collect.Maps;importorg.apache.commons.lang... 本文将用Python编程,带你了解股票投资收益和风险的基本知识。

一、股票的收益1.1导入CSV时序数据本文将分析微软2000年以来的股票交易数据(点我下载哦),它是一个csv格式的时间序列数据。

你将使用pandas读取csv数据,并存储为DataFrame格式。

该股票数据包括了交易日期、开盘价、最高价、最低价、收盘价、调整后的收盘价以及成交量。

其中调整后的收盘价最为重要,它对股票分割... 我的世界服务器游戏规则指令(详细)1.achievementgive[玩家名]用于赐予玩家成就。

2.blockdata用于编辑指定坐标的数据标签。

3.clear[物品][数据]清空该玩家的物品栏,或只清除特定的物品。

4.difficulty<0|1|2|3>改变游戏难度。

0为和平,1为容易,2为普通,3为困难,5.effectclear清除该玩家身上的所有... 一、插件安装方法File->Settings->Plugins,如下图所示二、MongoPluginMongoPlugin其实就是一款基于Pycharm的可视化数据库工具,通过它能可以很方便地对数据库进行可视化操作。

可以在编辑器界面的右侧打开该插件界面,如下图:三、StatisticStatistic是一个项目统计插件,可以给出一个项目的统计信息,包括文件和代... 随便推点 写这篇文章的起因是,当使用样式实现多行文本超出显示省略号的效果的时候,发现有的页面上省略号不是在文字末尾,而是在文字中间。

后来查了下竟是跟文字在a链接里显示有关。

下面详细说明下。

页面上文字超出部分用省略号表示,有多种方法可以实现,比如利用JS计算字数或是宽度,超出指定长度的字数,截断文字并用'...'拼接,比如可以用样式来简单控制,下面就介绍用样式实现的方法。

1.单行文字超出...... wireshark如何解析指定的payload实际测试中经常遇到此类问题,抓取的报文码流并不是从链路层开始,而是一些载荷协议或者从IP、TCP等开始,这个时候如何想要wireshark直接解析码流,就需要构造伪头部拼成完整报文结构。

那有没有不需要这么麻烦,而是直接就可以导入码流进行解析呢,答案是肯定的。

对于常见的场景,比如抓取的IP包或者TCP包,我们可以使用Wireskark:文件---->从HEX转储文件导入这里就可以选择不同的类型,然后导入即可。

但是这里提供的仅仅是常见. 安装 cnpminstallexpress--save 创建服务器 varexpress=require('express');varapp=express();app.listen(8888,function(){console.log('运行在8888端口')}) 路由 一、异同1、RSTP、RTMP、HTTP协议共同点RTSPRTMPHTTP都是用在应用层。

理论上这三种协议都可以做直播和点播,但直播一般用RTSP和RTMP点播用HTTP。

2、RSTP、RTMP、HTTP协议区别HTTP将数据作为文件处理,所以HTTP不是流媒体协议,RTMP和RTSP是流媒体协议。

RTMP是Adobe的私有协议,未完全公开,RTSP和HTTP是共有协议。

RTMP一般 在执行数据库连接时,报Nomodulenamedpymysql错误原因:  现在只安装DatabaseLibrary库,Python操作不同的数据库,还需要安装相应的数据库驱动,MySQL的数据库驱动是PyMySQL 解决方法:可以通过pip命令安装pymysql更为方便和快捷:... 基本概念障碍物是指妨碍机器人通行的静止状态和运动状态的物体。

避障是指移动机器人根据传感器感知到的障碍物的状态信息,包括障碍物的尺寸、形状和位置等,按照一定的方法进行有效地避障,最后达到目标点。

实现避障与导航的必要条件是环境感知,在未知或者是部分未知的环境下避障需要通过传感器获取周围环境信息。

基本思想Bug算法大概是人们能想象到的最简单的避障算法。

其基本思想是机器人在... 推荐文章 [不好分类]iphone手机激活错误的处理过程_aichuo1897的博客-程序员资料 qemu/kvm桥接_QEMU/KVM中的x数据平面功能_cuma2369的博客-程序员资料 实施流程_半夏沉香丶的博客-程序员资料 python踩坑笔记-Anaconda介绍及安装_来自星星的马的博客-程序员资料 Unix/C/C++--强制类型转换详解_worthsen的博客-程序员资料 论文阅读笔记:U-Net:ConvolutionalNetworksforBiomedicalImageSegmentation_HollowKnightZ的博客-程序员资料 java程序员的情书_Mars_froth的博客-程序员资料 C++primer第六版第八章编程练习_七黎的博客-程序员资料 热门文章 Android问题集锦之三十六:com.android.dex.DexException:Multipledexfilesdefine_全速前行的博客-程序员资料 JavaIO基础总结_hmxz1024的博客-程序员资料 我的Dll(动态链接库)学习笔记rivershan(原作)(转)_csd3176的博客-程序员资料 mysql5.6和5.7安装centos_aoying5106的博客-程序员资料 linux基础知识_iteye_4752的博客-程序员资料 获取LOL所有在售皮肤的价格和发布日期_Torres-圣君的博客-程序员资料 【资源分享】WindowsXPSP1可用的原版iso_ddmtjegb12140的博客-程序员资料 UltraScale时钟资源和时钟管理模块_碎碎思的博客-程序员资料_ultrascale和zynq7000区别 相关标签 知识图谱概念与技术pdf



請為這篇文章評分?