蒂姆·伯纳斯·李:让数据走向开放、透明

蒂姆·伯纳斯·李(Tim Berners-Lee)是万维网之父,这次他被邀请到TED大会现场,讲述关于互联网的故事。

蒂姆说,当初他创建世界上第一个网络浏览器以及服务器的时候,动力在于一种挫折感。那时他跟一班优秀的科学家一起工作,可是不同的人用不同的机器,他们所使用的文件格式也不尽一样。要想在这样的数据之上有所创建,就需要不断的转换格式,唯有如此才能挖掘出数据底层的无限潜力。蒂姆说,当时他给自己的老板写了份备忘介绍互联网的构想,可是,蒂姆的老板给他的答复是“想法还很模糊,但是很让人兴奋”(这还是在蒂姆的老板死后才发现的)。

尽管今日的互联网无限风光,但是蒂姆依然对于不能高效地在网络上获取数据而耿耿于怀。尽管我们都知道网络上有海量的数据,但是我们不懂得怎么去利用。汉斯·罗斯林(Hans Rosling)曾在TED大会上展示他的Gapminder数据分析模型,通过可视化的形式来窥探潜藏在数据背后的秘密。

蒂姆指出,互联网上的数据都是地下的,我们要把它们带到地上,让整个世界通过相互链接的数据而变得更有意义,蒂姆的做法是:

  • 以类似于html的格式来标示数据(tagging data in a format similar to HTML)
  • 获取有价值的数据(getting worthwhile data when you fetch it)
  • 揭示数据间的关系(getting relationships between the data)

蒂姆说我们需要获得这样的数据,因为这样会有助于催生新的科学发现,“相互链接的数据越多,数据的价值也越大。”dbpedia是一个有趣的项目,它所有的数据皆来自Wikipedia,但是通过一种非常直观的形式展现出来,读者可以很容易看得出数据间的联系。蒂姆说,假如奥巴马真的能够兑现将政府数据公开化的诺言,那么我们不但可以看到一个更开明的政府,还可以让学生去分析这样的数据,理解政府运作的新机理。而要治疗癌症、老年痴呆症、金融危机以至于气候变暖的问题,我们都需要实现数据共享,而不是关起门来,各搞各的。应当撕开社交型网站间的商业屏障,开放政府的数据。最后,蒂姆以一曲“Raw data now”结束了他的演讲。

以上的中文简述参考了伊凡·佐克曼(Ethan Zuckerman)的博客文章

相关阅读:

TED2009 – Tim Berners-Lee (Boingboing)
什么是语义网格
The Semantic Web, article by Tim Berners Lee
Tim Berners Lee on the semantic web, a YouTube video

照片:

题图照片来自Flickr,由whiteafrican上传于2009年2月5日,原作者选用的CC协议为”署名“。

插图照片来自Flickr上Tim Berners-Lee的照片,由whiteafrican上传于2009年2月5日,原作者选用的CC协议为”署名“。

TEDtoChina signature

您可以通过RSS阅读器订阅“TED中国粉丝团”的文章: http://www.tedtochina.com/feed/

欢迎发表评论,参与“TED中国粉丝团”的讨论组,或者在 twitter 上面 follow 我们。

参与越多,您也会学到更多。

《蒂姆·伯纳斯·李:让数据走向开放、透明》上的5个想法

  1. 转载一个Solidot上面看到的语义网研究的消息:

    欧洲研究人员开发出一种语义网格浏览器Sealife,能理解生命科学中的术语,自动寻找额外的资源和服务。它或许能发展成下一代智能搜索引擎。生物科学社区已经建立了众多数据库,例如基因排序和其它疾病信息数据库,作为网格服务提供给研究人员。Sealife项目协调员Michael Schroeder称,网络的网格服务大都是独立的,Sealife能无缝的将它们整合在一起。浏览器的关键是语义超链接,把用户直接引入到相关服务。浏览器首先理解网页上的内容,识别出能链接到网格服务器上的术语。以人类基因为例,平均每个基因有5.5个名字,但Sealife都能正确识别它们,并提供关于此基因更丰富信息的超链接。浏览器需要很好的处理模棱两可的意思,比如“美洲虎”,它是一种动物,一辆汽车,还是苹果的OSX操作系统?Sealife使用特殊的算法判断上下文背景,正确解释它的含义。目前Sealife算法的成功率为87%。

    原文地址:http://science.solidot.org/article.pl?sid=09/05/21/1126224&from=rss

发表评论

电子邮件地址不会被公开。 必填项已用*标注