鏈結資料

鏈結資料(Linked data)在電腦科學領域,是指經過結構化處理的資料,這些資料因彼此互相鏈結(linked),而能透過語意查詢的方式變得更有用處。鏈結資料利用了現有的網路標準技術,例如HTTP、RDF與 URI,其應用超出了只是為人類提供網頁資訊,而是要讓電腦能自動讀取與理解資訊。[1][2]
全球資訊網協會(W3C)主席蒂姆·伯納斯-李 ,在2006年語意網計畫的筆記中,創造了「Linked Data」這個名詞。[3]鏈結資料的願景之一,是要讓網際網路成為一個全球資料庫。
鏈結資料可以是開放資料,在這種情況下稱作鏈結開放資料(Linked Open Data)。
譯詞
[编辑]中國大陸譯為「链接数据」[4]、「关联数据」[5],台灣譯作「链结资料」[6],其他用過的譯詞包括「键连资料」、「资料连结」、「连结资料」、「关联资料」等[7]。
原則
[编辑]蒂姆·伯納斯-李(Tim Berners-Lee)在2006年的筆記中,提出鏈結資料的四大原則[3]:
- 所有概念性的事物都應擁有一個以 HTTP 作為起始的名稱。
- 查詢 HTTP 名稱應以標準格式回傳關於該事物的有用資料。
- 透過其資料,和該事物有關係的任何其他事物,也應賦予以HTTP 作為起始的名稱。
組成
[编辑]- Uniform Resource Identifier,URI
- Hypertext Transfer Protocol,HTTP
- 結構化資料:使用控制字彙( controlled vocabulary)的術語和資料集的定義,並以資源描述框架(Resource Description Framework,RDF)序列化格式,例如 RDFa、RDF/XML、Notation3、Turtle 或 JSON-LD,來表示結構化資料。
- 鏈結資料平台
鏈結開放資料
[编辑]鏈結開放資料是成為開放資料的「鏈結資料」。[9][10][11]
蒂姆·伯納斯-李定義了「鏈結開放資料」與「鏈結資料」的區別:
「鏈結開放資料」是在開放授權下釋出的「鏈結資料」,該授權不阻礙資料能自由的再次使用。
大型的「鏈結開放資料集」包括DBpedia 、Wikidata、Wikibase和Open ICEcat。
歷史
[编辑]「鏈結開放資料」(Linking Open Data)這個術語至少從2007年2月以來就已經在使用,也就是「Linking Open Data mailing list」建立之時。[13] [14]該郵件清單是由麻省理工學院的SIMILE計畫管理。[15]。
鏈結開放資料計畫
[编辑]

W3C 語意網教育與推廣小組(Semantic Web Education and Outreach group)旗下的「鏈結開放資料」(Linking Open Data)社群專案,目標是透過在網路上以 RDF 格式發佈各種開放資料集,並在不同資料來源的資料項目間建立 RDF 連結,擴展網路成為一個資料共享平台(data commons)。2007 年 10 月,資料集包含超過二十億個 RDF Triples,透過兩百萬多個 RDF 連結相互連結。[17][18] 到 2011 年 9 月,數量成長至三百一十億個 RDF Triples,連結約五億零四百萬個 RDF 連結。2014 年發表了詳細的統計分析報告。[19]
歐盟計畫
[编辑]歐盟有多個涉及鏈結資料的專案,包括「全天候鏈結開放資料」(Linked Open Data Around The Clock, LATC)專案,[20]機器可讀取立法資料的 AKN4EU 專案,[21]PlanetData 專案,[22]資料與平台即服務(DaPaaS, Data-and-Platform-as-a-Service)專案,[23]以及鏈結開放資料 2(Linked Open Data 2, LOD2)專案。[24][25][26]資料的連結是歐盟開放資料門戶(EU Open Data Portal)的主要目標之一,該網站提供數千筆資料集,供任何人重複使用與連結。
知識本體
[编辑]知識本體(Ontology)是資料結構的正式描述。其中較著名的知識本體包括:
- FOAF(Friend of a Friend)— 描述人物、其屬性與關係的本體
- UMBEL(Upper Mapping and Binding Exchange Layer) — 一個輕量級的參考結構,包含約 20,000 個主題概念類別及其關係,這些概念來自 OpenCyc,可作為外部資料的綁定類別;同時連結了 DBpedia 與 YAGO 等資料庫中的約 150 萬個具名實體
資料集
[编辑]- DBpedia – 自維基百科擷取資料的鏈結開放資料集。
- GeoNames- 全球地名及其基本資訊的鏈結開放資料集。
- Wikidata – 維基媒體基金會於2012 年發起的結構化資料儲存專案。
- Global Research Identifier Database - 學術研究的機構的國際資料庫。
- 上海圖書館开放数据平台 – 上海圖書館建置,包含人名、姓氏、歷史紀年、地理名詞、機構名錄、印章、避諱字等資料。
- 链结开放资料平台 – 中央研究院數位文化中心建置,將中研院執行數位典藏計畫以及各研究所製作的數位資料轉換為鏈結資料,涵蓋生物學、人類學、宗教、藝術、影音、歷史等領域。
- DILA 链结开放资料平台 - 法鼓文理學院建置,將「佛學規範資料庫」內的人物與地點資料,轉換為鏈結資料的格式。[27]
參見
[编辑]參考文獻
[编辑]- ^ Linked Data as JSON. Linked Data as JSON. [2020-12-04] (英语).
- ^ 黃韋菁; 李承錱; 莊庭瑞. 結構資料的再次使用:語意、連結與實作. 圖書館學與資訊科學. 2017, 43 (1).
- ^ 3.0 3.1 3.2 Tim Berners-Lee. Linked Data. Design Issues. W3C. 2006-07-27 [2010-12-18]. (原始内容存档于2019-05-23).
- ^ 术语在线 - 链接数据.
- ^ 上海图书馆开放数据平台.
- ^ 樂詞網 - 鏈結資料.
- ^ 國家編目園地 - 國家圖書館編目規範討論會會議摘要.
- ^ Tim Berners-Lee on the next Web. [2018-10-23]. (原始内容存档于2011-04-10).
- ^ Frequently Asked Questions (FAQs) - Linked Data - Connect Distributed Data across the Web. [2018-10-23]. (原始内容存档于2015-11-18).
- ^ COAR » 7 things you should know about…Linked Data. [2018-10-23]. (原始内容存档于2015-11-18).
- ^ Linked Data Basics for Techies. [2018-10-23]. (原始内容存档于2021-05-05).
- ^ 5 Star Open Data. [2018-10-23]. (原始内容存档于2021-05-08).
- ^ public-lod@w3.org Mail Archives. [2018-10-23]. (原始内容存档于2021-04-17).
- ^ SweoIG/TaskForces/CommunityProjects/LinkingOpenData/NewsArchive. [2018-10-23]. (原始内容存档于2020-09-27).
- ^ SIMILE Project - Mailing Lists. [2018-10-23]. (原始内容存档于2016-01-21).
- ^ Linking open data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/ (页面存档备份,存于互联网档案馆)
- ^ SweoIG/TaskForces/CommunityProjects/LinkingOpenData - W3C Wiki. esw.w3.org. [22 March 2018]. (原始内容存档于2009-11-16).
- ^ Fensel, Dieter; Facca, Federico Michele; Simperl, Elena; Ioan, Toma. Semantic Web Services. Springer. 2011: 99. ISBN 3642191924.
- ^ Max. State of the LOD Cloud. linkeddatacatalog.dws.informatik.uni-mannheim.de. [22 March 2018]. (原始内容存档于2021-02-24).
- ^ Linked open data around the clock (LATC). latc-project.eu. [22 March 2018]. (原始内容存档于19 September 2018).
- ^ Flatt, Amelie; Langner, Arne; Leps, Olof, Model-Driven Development of AKN Application Profiles: Background and Requirements
, Model-Driven Development of Akoma Ntoso Application Profiles (Cham: Springer International Publishing), 2022: 5–12 [2023-01-07], ISBN 978-3-031-14131-7, doi:10.1007/978-3-031-14132-4_2 (英语)
- ^ Welcome to PlanetData! - PlanetData. planet-data.eu. [22 March 2018]. (原始内容存档于21 April 2021).
- ^ DaPaaS. project.dapaas.eu. [22 March 2018]. (原始内容存档于18 December 2020).
- ^ Linking Open Data 2 (LOD2)
- ^ CORDIS FP7 ICT Projects – LOD2. European Commission. 2010-04-20.
- ^ LOD2 Project Fact Sheet – Project Summary (PDF). 2010-09-01 [2010-12-18]. (原始内容 (PDF)存档于2011-07-20).
- ^ 洪振洲. 開放資料服務於漢籍數位人文研究資源之發展與應用 (PDF). 第 13 次中文文獻資源共建共享合作會議. 2021.
延伸閱讀
[编辑]- Ahmet Soylu, Felix Mödritscher, and Patrick De Causmaecker. 2012. “Ubiquitous Web Navigation through Harvesting Embedded Semantic Data: A Mobile Scenario.” (页面存档备份,存于互联网档案馆) Integrated Computer-Aided Engineering 19 (1): 93–109.
- Linked Data: Evolving the Web into a Global Data Space (页面存档备份,存于互联网档案馆) (2011) by Tom Heath and Christian Bizer, Synthesis Lectures on the Semantic Web: Theory and Technology, Morgan & Claypool
- How to Publish Linked Data on the Web (页面存档备份,存于互联网档案馆), by Chris Bizer, Richard Cyganiak and Tom Heath, Linked Data Tutorial at Freie Universität Berlin, Germany, 27 July 2007.
- The Web Turns 20: Linked Data Gives People Power (页面存档备份,存于互联网档案馆), part 1 of 4, by Mark Fischetti, Scientific American 2010 October 23
- Linked Data Is Merely More Data – Prateek Jain, Pascal Hitzler, Peter Z. Yeh, Kunal Verma, and Amit P. Sheth. In: Dan Brickley, Vinay K. Chaudhri, Harry Halpin, and Deborah McGuinness: Linked Data Meets Artificial Intelligence. Technical Report SS-10-07, AAAI Press, Menlo Park, California, 2010, pp. 82–86.
- Moving beyond sameAs with PLATO: Partonomy detection for Linked Data – Prateek Jain, Pascal Hitzler, Kunal Verma, Peter Z. Yeh, Amit Sheth. In: Proceedings of the 23rd ACM Hypertext and Social Media conference (HT 2012), Milwaukee, WI, USA, June 25–28, 2012.
- Freitas, André, Edward Curry, João Gabriel Oliveira, and Sean O’Riain. 2012. “Querying Heterogeneous Datasets on the Linked Data Web: Challenges, Approaches, and Trends.” (页面存档备份,存于互联网档案馆) IEEE Internet Computing 16 (1): 24–33.
- Linked Data on the Web (页面存档备份,存于互联网档案馆) – Chris Bizer, Tom Heath, Kingsley Uyi Idehen, Tim Berners-Lee. In Proceedings WWW2008, Beijing, China
- Interlinking Open Data on the Web – Chris Bizer, Tom Heath, Danny Ayers, Yves Raimond. In Proceedings Poster Track, ESWC2007, Innsbruck, Austria
- Ontology Alignment for Linked Open Data – Prateek Jain, Pascal Hitzler, Amit Sheth, Kunal Verma, Peter Z. Yeh. In proceedings of the 9th International Semantic Web Conference, ISWC 2010, Shanghai, China
- Linked open drug data for pharmaceutical research and development (页面存档备份,存于互联网档案馆) - J Cheminform. 2011; 3: 19. Samwald, Jentzsch, Bouton, Kallesøe, Willighagen, Hajagos, Marshall, Prud'hommeaux, Hassenzadeh, Pichler, and Stephens (May 2011)
- Interview with Sören Auer, head of the LOD2 project about the continuation of LOD2 in 2011 (页面存档备份,存于互联网档案馆), June 2011
- Linked Open Data: The Essentials (页面存档备份,存于互联网档案馆) - Florian Bauer and Martin Kaltenböck (January 2012)
- The Flap of a Butterfly Wing - semanticweb.com Richard Wallis (February 2012)
外部連結
[编辑]介紹
[编辑]- Tim Berners-Lee - Linked Data
- W3C Wiki - Linked Data
- 連結世界的下水道工程——鏈結開放資料(中研院數位文化中心《數位文化誌》文章)
- 圖書館鏈結資料入門指引(台灣國家圖書館發行的政府出版品)
資料集
[编辑]- Linked Open Data Cloud
- DBpedia
- European data(European Union Open data Portal)
- 上海图书馆开放数据平台
- 中央研究院數位文化中心 链结开放资料平台
- DILA 链结开放资料平台