数据链接

数据链接(又称:“链接数据”、“键连数据”,英文: Linked Data)在计算 (计算机科学)),是一种发布“结构化数据”链接的方法,使数据间彼此相互链接。同时透过语义查询.[1] 使链接的数据更为有用。数据链接技术以万维网 标准为主,例如HTTP资源描述架构(RDF)以及统一资源标志符(URIs)。“数据链接”主要提供机器与机器间,可自动交换的一种数据分享的方式。换言之,“数据链接”关系了数据(data)、常人(human)以及机器(machine)三者在知识呈现与语义处理的共有课题。[2]

蒂姆·伯纳斯-李, 万维网联盟(W3C)主席,在2006年一个与语义网项目有关的设计笔记中提出了”Linked Data”/“数据链接”这个名词。[3]

“数据链接”亦可以是开放数据的一种,在此脉络下通称为开放数据链接(Linked Open Data)。

主要原则

蒂姆·伯纳斯-李在2006年提出“数据链接”四大原则,2009年更简化为三大原则:

2006年的笔记中,蒂姆·伯纳斯-李提出“数据链接”的四大原则如下[3]:

  1. 使用统一资源标志符(URIs)命名(识别)对象。
  2. 使用HTTP URIs,因此对象得以被查询(被解释/阐释(interpreted)与区分识别(dereferenced)。
  3. 当对象被查询时,使用开放标准如RDF, SPARQL等,针对此命名之对象提供有用的信息。
  4. 当对象被发布时,使用以HTTP URI的命名方式来指称其他对象。

2009年在TED大会中,蒂姆·伯纳斯-李重申三大“极其简单”的“数据链接”原则如下:[4]

  1. 所有概念性的事务皆有以HTTP开始的命名
  2. 倘若我查询一个以HTTP命名的对象,我将会得到一个有用的标准化格式数据。此数据包含了与此对象相关的事物与事件的描述。
  3. 当我回到此信息时,此信息不仅包括某人的身高体重、出生时间,此信息还包括了关系。有此关系后,被相关的事务则被赋予以HTTP开始命名的名称。

主要元素

  • 统一资源标志符(URIs)
  • HTTP
  • 结构化数据使用以资源描述架构(RDF)序列化之格式如 RDFa, RDF/XML, N3, Turtle, 或JSON-LD控制语汇的词汇与数据定义。
  • 数据链接平台/(Linked Data Platform)

开放数据链接 (Linked Open Data)

开放数据链接开放数据的“数据链接”。[5][6][7] 蒂姆·伯纳斯-李清楚定义了“开放数据链接”与“数据链接”的不同:

1
2


“开放数据链接”(LOD) 是以开放授权发布的“数据链接”。此发布并不阻碍数据自由的再次使用。

——Tim Berners-Lee,Linked Data[3][8]

大量的“开放数据链接”数据集包括DBpediaWikidata

历史溯源

“开放数据链接”(LOD)这个词汇至少自2007年2月LOD邮件论坛创建时即开始使用。[9] [10]此邮件论坛是由麻省理工学院的SIMILE项目主导。[11]

开放数据链接项目

2014 8月LOD数据及链接情形. 此图由2017年开始的Linked Open Data Cloud 项目制作。部分数据集可能包括可自由获取的著作权数据。[12]

2014 8月LOD数据及链接情形. 此图由2017年开始的Linked Open Data Cloud 项目制作。部分数据集可能包括可自由获取的著作权数据。[12]

2017年2月发布,与上图比较2年半后的快速成长情形。.

2017年2月发布,与上图比较2年半后的快速成长情形。

W3C Semantic Web Education and Outreach group 的开放数据链接项目,目的是借由发布RDF格式的开放知识数据集,以及创建不同数据集中数据间的RDF链接,进而以data commons扩展万维网。2007年10月, 数据集包含超过由二百万相互链接的RDF links所链接的二十亿 RDF triples。[13][14] 至2011年9月则发展至5百零4万相互链接的RDF links所链接的三十亿个RDF triples。2014年发布详细的统计数据。[15]

欧盟项目

许多欧洲联盟项目均包含“数据链接”,例如: LATC项目、[16] PlanetData 项目、[17]、DaPaaS (Data-and-Platform-as-a-Service)项目[18]以及LOD2 项目[19][20]。而数据的链接也成为欧盟开放数据入口网促使千笔数据集开放使用与链接的主要目的。

数据集(Datasets)

  • DBpedia – 自维基百科截取数据的“开放数据链接”数据集。
  • GeoNames - “开放数据链接”全球地名数据库。
  • Wikidata – 维基媒体基金会于2012 年推动以数据知识库为主而成为维基百科的知识架构基础。

参考资料

  1. ^ Bizer, Christian; Heath, Tom; Berners-Lee, Tim. Linked Data – The Story So Far(PDF). International Journal on Semantic Web and Information Systems 5. 2009.doi:10.4018/jswis.2009081901.
  2. ^ Huang, Andrea Wei-Ching; Lee, Cheng-Jen; Chuang, Tyng-Ruey. 结构资料的再次使用:语意、连结与实作. Journal of Library and Information Science43. 2017.doi:10.6245/JLIS.2017.431/722.
  3. ^ 3.0 3.1 3.2 Tim Berners-Lee. Linked Data. Design Issues.W3C. 2006-07-27[2010-12-18].
  4. ^ Tim Berners-Lee on the next Web.
  5. ^ Frequently Asked Questions (FAQs) - Linked Data - Connect Distributed Data across the Web.
  6. ^ COAR » 7 things you should know about…Linked Data.[2018-10-23]. (原始内容存档于2015-11-18).
  7. ^ Linked Data Basics for Techies.
  8. ^ 5 Star Open Data.
  9. ^ public-lod@w3.org Mail Archives.
  10. ^SweoIG/TaskForces/CommunityProjects/LinkingOpenData/NewsArchive.
  11. ^ SIMILE Project - Mailing Lists.
  12. ^ Linking open data cloud diagram 2014, by Max Schmachtenberg, Christian Bizer, Anja Jentzsch and Richard Cyganiak. http://lod-cloud.net/
  13. ^SweoIG/TaskForces/CommunityProjects/LinkingOpenData - W3C Wiki. esw.w3.org. [22 March2018].
  14. ^ Fensel, Dieter; Facca, Federico Michele; Simperl, Elena; Ioan, Toma. Semantic Web Services. Springer. 2011: 99.ISBN 3642191924.
  15. ^ Max. State of the LOD Cloud. linkeddatacatalog.dws.informatik.uni-mannheim.de.[22 March 2018].
  16. ^ Linked open data around the clock (LATC). latc-project.eu.[22 March 2018].
  17. ^ Welcome to PlanetData! - PlanetData. planet-data.eu. [22 March2018].
  18. ^ DaPaaS. project.dapaas.eu.[22 March 2018].
  19. ^ CORDIS FP7 ICT Projects – LOD2. European Commission. 2010-04-20.
  20. ^ LOD2 Project Fact Sheet – Project Summary (PDF). 2010-09-01 [2010-12-18]. (原始内容 (PDF)存档于2011-07-20).

延伸阅读

外部链接

来了,老弟
-------------    本文结束  感谢您的阅读    -------------
0%