知識圖譜方法、實踐和應用(二) - 台部落
文章推薦指數: 80 %
知識圖譜方法、實踐和應用(二) · 客觀事物的機器表示 · 一組本體約定和概念模型 · 支持推理的表示基礎 · 用於高效計算的數據結構 · 人可理解的機器語言.
請輸入正確的登錄賬號或密碼
註冊
忘記密碼
首頁
從零開始知識圖譜
正文
知識圖譜方法、實踐和應用(二)
原創
杨打滚
2020-05-2618:37
二、知識圖譜表示與建模
知識表示的五大用途:
客觀事物的機器表示
一組本體約定和概念模型
支持推理的表示基礎
用於高效計算的數據結構
人可理解的機器語言
歷史關係:
語義網絡表示方法(Wordnet)(M.RossQuilian&Allan M.Collins),屬於詞典類型的知識庫,主要定義名詞、動詞、形容詞副詞之間的語義關係。
隨着專家系統的提出和發展,知識庫構建和知識表示更受到重視。
傳統專家系統包含(知識庫和推理引擎)兩個模塊
規範語義理論模型和形式化語義定義——描述性邏輯語言。
成爲大多數本體語言(OWL)的理論基礎。
(知識表示能力和推理計算複雜性的綜合考慮)
OWL系列標準化本體語言:DBpediaYagoFreebaseSchemaORGWikidata,擁有以符號邏輯爲基礎的知識表示方法:易於刻畫顯式、離散的知識而具有內生的可解釋性,但由於人類知識包含大量不易於符號化的隱形知識,所以催生了採用連續向量的方式來表示知識
兩種表示方式
基於離散符號的知識表示:RDF\OWL\Rulelanguage:顯式知識、強邏輯約束、易於解釋、推理不易擴展
基於連續向量的知識表示:Tensor、embedding:隱式知識、弱邏輯約束、不易解釋、對接神經網絡
早期的知識表示方法:
一階謂詞邏輯
霍恩子句和霍恩邏輯
語義網絡
優點
聯想性、可解釋性
易用性、自然語言與之轉換容易
結構性、各種事物之間的聯繫直觀表達
缺點
無形式化語法
無形式化語義(含義具有多種可解釋性,從而通過推理網絡而獲得的推理不能保證其正確性)
框架(frame)
描述對象屬性的數據結構,類似於class
優點
結構性強
對知識的描述很全面
缺點
構建成本很高,對知識庫的質量要求很高
推理複雜度高
無法表示不確定的知識
描述邏輯
是一階邏輯的可判定子集,可以看做是一階邏輯對語義網絡/框架進行形式化以後的產物。
互聯網本體語言(OWL)的理論基礎
一元謂詞:稱爲類
二元謂詞:稱爲關係
2.3互聯網時代的語義網知識表示框架
RDF和RDFS
對W3C的語義網標準棧做了分組
RDF都爲三元組的數據,以主語-謂語-賓語構成,將謂語看做邊,主語賓語看做節點。
其中主語是某個類的實例(對象)
開放世界假設:知識圖譜的知識可以被分佈存儲,並自由合併。
(比如jeff是KG講座的speaker,但是KG講座不一定只有jeff一個speaker,jeff也可能同時是別的講座的speaker)
RDF中使用的類和屬性來描述個體關係的部分,由RDFS(RDFSchema)提供簡單描述。
數據層面的知識:
模式層面的知識:
RDFs例子:
OWL和OWLFragments
RDFs的語義表達能力太弱,缺少常用特徵,更細緻的特徵由OWL來補足
OWL語言特徵
PS:目前沒有推理系統可以完全支持OWLFull
OWL重要詞彙
1.等價性聲明:聲明兩個類、屬性和實例是等價的
exp:運動員owl:equivalentClassexp:體育選手exp:
exp:運動員 owl:equivalentClassexp:體育選手
exp:獲得 owl:equivalentPropertyexp:取得
exp:運動員 Aowl:sameIndividualAsexp:小明
2.屬性傳遞聲明
exp:ancestor rdf:typeowl:TransitiveProperty意思是exp:ancestor是一個傳遞關係,那麼由exp:ancestor鏈接的兩個對象將有傳遞性
exp:aexp:ancestorexp:b&exp:bexp:ancestorexp:c---->exp:aexp:ancestorexp:c
3.屬性互逆聲明
exp:xowl:inverseOfexp:y代表x和y是互逆的,所以可以推導出:
expAexp:xexpB---->expBexp:yexp:A
4.屬性的函數聲明
exp:hasmother rdf:typeowl:FunctionalProperty意思是exp:hasmother是一個函數即一個生物只能有一個母親(自然約束)
5.屬性的對稱性說明
exp:friend rdf:typeowl:SymmetricProperty指的是exp:friend是一個具有對稱性的屬性,如果exp:小明exp:friendexp:小林,那麼反過來也是可以的
6.全稱限定聲明。
聲明一個屬性是全稱限定
exp:Personowl:allValuesFromexp:Women
exp:Personowl:onPropertyexp:hasMother
表示hasMother在主語屬於person類的條件下,賓語的取值只能來源於women類
7.屬性存在限定聲明,聲明一個屬性是存在限定:
8.屬性基數限定聲明
9.相交類聲明,一個類是等價於兩個類相交:
其他屬性
OWL2中的子語言
OWL2QL
基於本體的查詢設計的,適合大規模處理,基於DL-Lite
詞彙總結
OWL2EL
能提供多項式推理
詞彙總結
SPAROL查詢語言的表示
語義markup表示語言
語義網進一步定義了在網頁中嵌入語義markup的方法和表示語言。
被google知識圖譜以及schema.org採用的語義markup語言主要包括json-LD、RDFa和HTML5MicroData
Json-LD
通過json格式表示有向圖,在文檔中混合表示鏈接數據和非鏈接數據
例子
RDFa
HTML5microdata
常見開放知識圖譜表示方法
freebase
wiki
conceptnet5:更接近自然語言,關係(邊)很大一部分從文本中抽取,所以接近自然語言文本
知識圖譜向量表示方法
詞的向量表示方法
one-hot編碼
詞袋模型(bag-of-word,BoW)
每一行代表列中的各種詞在文檔i中出現的次數
詞向量模型
word2vec中的兩個經典模型
連續詞袋模型CBoW
用上下文詞預測中心詞
skip-gram模型
用中心詞預測上下文
詞向量模型具有一定的空間平移性質可以通過向量的求和求差來定義某種關係
知識圖譜的嵌入概念(knowledgegraphembedding)
需要進行監督學習,使訓練的過程中學習一定的語義信息。
模型TransE的思想:如果一個三元組(h,r,t)成立,必須滿足h+r~=t的關係
舉例
知識圖譜嵌入方法介紹
轉移距離模型TranslationalDistanceModel
將衡量向量化後的知識圖譜中三元組的合理性--->轉化爲---->衡量頭實體和尾實體的距離問題
重點在於:如何設計得分函數將頭實體轉移爲尾實體
head+relation~=tail
語義匹配模型SemanticMatchingModels
更注重挖掘向量化後的實體和關係的潛在語義,主要是RESCAL以及他的延伸模型
將知識圖譜編碼爲一個三維張量,張量分解爲一個核心張量和一個因子矩陣:
核心張量中每兩個二維矩陣切片代表一種關係
因子矩陣中每一行代表一個實體
由核心張量和因子矩陣還原的結果看做三元組成立的概率,如果概率大於某個閾值,則正確,否則不正確。
得分函數如下:相關paper[14]
考慮附加信息的模型
PTransE考慮相加、相乘、RNN三種關係表達關係路徑的方法
文本描述:規則學習和知識圖譜嵌入學習相互迭代,最後使得知識圖譜嵌入可以融入一定的規則信息(Guo[19])
知識圖譜嵌入的應用
鏈接預測
遍歷實體帶入知識圖譜嵌入的得分函數,得分高的作爲預測值
三元組分類
三元組帶入得分函數,得分高即爲真實性和合理性高
實體對齊(EntityResolution)又稱爲實體解析
驗證兩個實體是否指代的是同一個事物或對象
問答系統
得分函數的具體paper([9])
推薦系統
zhang[20]
從零開始知識圖譜
發表評論
登录
所有評論
還沒有人評論,想成為第一個評論的人麼?請在上方評論欄輸入並且點擊發布.
相關文章
杨
杨打滚
24小時熱門文章
ESP8266開發之旅進階篇②閒聊ArduinoIDEForESP8266配置
Ubuntu設置關機重啓快捷鍵
office365和office2016永久使用
QtQListViewQStringListModel用法詳解
rancherrke安裝k8s報錯[network]Host[]isnotabletoconnecttothefollowingports:[:10250][:2379]
nodejs讀取圖片並將二進制數據轉換成base64格式
catkin_make安裝realsenseD435I的ROS包報錯:notfind...ddynamic_reconfigureConfig.cmake
磨豆腐是什麼意思
開源C#Winform控件庫《SunnyUI》強力推薦
ดูหนังDoctorStrange2[จอมเวทย์มหากาฬกับมัลติเวิร์สมหาภัย](2022)เต็มเรื่องHDพากย์ไทยTHAI
最新文章
知識圖譜方法、實踐和應用(二)
直播-知識表徵-朱瑞
LEXTALE_CH:AQuick,Character-BasedProficiencyTestforMandarinChinese
DevelopmentalchangesintheearlychildlexiconinMandarinChinese*
珠心算
最新評論文章
dayjs時間轉換,模糊時間、精確時間
ElasticSearch7.3學習(三十四)----生產環境集羣部署總結
ElasticSearch基本使用姿勢二
Redis一主三從三哨兵之Docker-compose
問題是表象,淡定纔有解決的可能
跌倒,成年人都是自己爬起來的
興致勃勃的活着,真的那麼難嗎?
問題是表象,淡定纔有解決的可能
“包辦式”未來V.S“自由式”未來,你的選擇正確了嗎?01020304
延伸文章資訊
- 1知识图谱:方法、实践与应用(博文视点出品) - 图书 - 京东
京东JD.COM图书频道为您提供《知识图谱:方法、实践与应用(博文视点出品)》在线选购,本书作者:王昊奋,漆桂林,陈华钧,出版社:电子工业出版社。买图书,到京东。
- 2蝦皮購物
知識圖譜方法實踐與應用知識圖譜構建與應用實戰技能知識存儲知識圖譜推理機器學習基礎入門自然語言處理AI人工智能. $869. $1,241. 尚無評價. 0 已售出.
- 3知識圖譜方法、實踐和應用(二) - 台部落
知識圖譜方法、實踐和應用(二) · 客觀事物的機器表示 · 一組本體約定和概念模型 · 支持推理的表示基礎 · 用於高效計算的數據結構 · 人可理解的機器語言.
- 4《知识图谱:方法、实践与应用》(王昊奋,漆桂林,等)电子书 ...
《知识图谱:方法、实践与应用》(王昊奋,漆桂林,等)内容简介: 知识图谱是较为典型的多学科交叉领域,涉及知识工程、自然语言处理、机器学习、图数据库等多个领域。
- 5方法、實踐與應用(簡體書)電子工業118~XOMF142439 - 奇摩拍賣
9787121366710知識圖譜:方法、實踐與應用(簡體書)電子工業118~XOMF142439 | 店長提示:產品規格較多,賣場都是最低規格售價哦,下標前請先聯繫小店客服報價哦,謝謝, ...