本书正是一本我们所需要的关联数据技术指南。对于如何在万维网上使用和发布结构化数据,本书作了有益的介绍。

关联数据体现了我对万维网的最初设想,它是未来万维网的重要组成部分。万维网作为一种超链接文档的集合,虽然适合人类用户使用,却无法有效地用作数据。

实际上,大部分万维网都是数据驱动的,数据隐藏在服务器内部的文件中。1994年,我在第一届国际万维网大会(International Conference of World Wide Web)总结发言的幻灯片中指出,文档在描述人物和事物(比如房屋产权地契)时,并未采用便于处理的方式捕获数据(实际所有权)。随着万维网的发展,其数据驱动的特质越来越明显。遗憾的是,无法将变化和隐藏的数据展示给用户。而发布遵循关联数据标准的数据有助于人类阅读和机器处理,从而让之前隐藏的数据流得以显现。

关联数据或许不像超文本万维网那样广为人知,但它能在很大程度上提高商业、科研等各个领域的工作效率。与万维网上其他形式的数据相比,机器可以更有效地读取、跟踪与组合关联数据。

一直以来,机器都被定位于从技术层面协助人们进行交流;如今,机器开始积极参与到这种交流之中。藉由关联数据,机器在人们的日常生活中发挥了越来越大的作用。

最近几年来,关联数据的应用已进入成熟期。在过去两年中,Google宣布推出知识图谱服务,并在Gmail中采用JSON-LD序列化格式,还为Schema.org贡献了大量通用术语;IBM宣布将DB2数据库升级为关联数据服务器;Facebook则通过图谱API向外界公开关联数据。其他大型企业和政府机构也纷纷跟进。为了向刚刚涉足这个领域的程序员介绍关联数据开发,我们需要一本与本书类似的图书。本书将解答读者关心的问题——即便它无法提供所有问题的答案。对于希望了解、使用和发布关联数据的开发人员而言,本书是一本很好的教程。

我和本书作者Dave Wood认识已有十年,他开始为万维网联盟工作时我们就已相识。之后,我们共同从事一项研究。从20世纪90年代末以来,Dave一直在为开发语义网和关联数据框架而不懈努力。作为一名开发人员,Dave很好地展示了他的工作能力。

关联数据并非一个全新的概念。1989年,我在欧洲核子研究中心(CERN)工作时,撰写的万维网原始建议[1]中就包括带有语义的超链接。建议中提到,“我们需要的系统类似于一个由圆圈和箭头组成的图表,这些圆圈和箭头可以代表任何内容”。这是我当时的愿景。实际上,我在1980年开发的Enquire程序已能捕获图谱中各种事物之间的关系。如今,通过增加计算机可以处理的含义,关联数据正在让这一愿景逐步成为现实。

众所周知,在基本的超文本万维网中,所有箭头都指向同一件事:“这里的信息很有趣!”关联数据支持使用箭头表示可以通过URI命名的任何事物,从而扩展了“文档万维网”的范畴。超链接可以获得所需的语义,并会在这个过程中变得更加有用。

功能强大的关联数据网是对超文本链接文档网的有益补充。之所以“链接”,是因为网页的价值在很大程度上取决于所链接的内容,以及网页中信息的内在价值。关联数据的语义网同样如此,可能更甚。数据本身的价值已然不菲,与其他数据的链接让这种价值再次提升。

我认为,无论国籍、语言、经济动因或兴趣如何,万维网的发展应遵循为所有人服务的宗旨。关联数据只是发展浪潮中的一分子,它并非结束,而是另一个开始。仍有大量工作等着我们去做,欢迎大家投身于下一代万维网的发展之中!

Tim Berners-Lee[2]

万维网联盟主席

2016年度图灵奖得主

麻省理工学院工程系教授

南安普顿大学电子与计算机科学系教授


[1] 这份名为《关于信息管理的建议》(Information Management: A Proposal)涉及Enquire,并提出了一个更为精巧的信息管理系统,后者基于嵌入到可读文本的链接。原文参见https://www.w3.org/History/1989/proposal.html。——译者注

[2] Tim Berners-Lee,1955—,英国计算机科学家,万维网发明者,被称为“万维网之父”,曾入选《时代》周刊“20世纪最重要的100位人物”。Tim放弃了申请万维网的专利,将这项技术无偿推向全世界,极大地改变了人类的生活方式。2017年4月,Tim因“发明万维网、第一个Web浏览器以及支持万维网扩展的基础协议和算法”而获得2016年度图灵奖。图灵奖是计算机领域的最高荣誉,有“计算机界的诺贝尔奖”之称。——译者注

目录

相关技术