扫一扫
分享文章到微信
扫一扫
关注官方公众号
至顶头条
当人们在电脑搜索框中输入“苹果”两个字,汹涌而来的各色信息让我们头晕脑胀:“苹果示范园”,“吃苹果的七大好处”,“苹果中国人事大变动”,“苹果单 车的店铺”……在所有这些反馈的信息中,只有一小部分是你想要的。如果你是数码产品发烧友,你期待看见的可能是苹果手机、苹果电脑;如果你是水果批发商, 你会对“苹果示范园”感兴趣;如果是想美容的女士,就会看看“吃苹果的七大好处”。
你要的是哪个“苹果”?
目前的网络搜索,仅仅能够反馈给用户夹杂着各种噪音和无用信息的“信息大包裹”,用户得人工分拣出有用信息。但随着一种新软件Twine的出现,这种情况有可能彻底改观。
位于美国芝加哥的Radar Network公司正在开发一种新软件,有望大大提高人们的搜索效率。
人们所要做的,就是登陆Twine网站,把自己的日常资料一股脑地“倾倒”进这个软件,之后就可以轻松离开,Twine会用一眨眼的工夫帮你把一切资料贴上电子标签,分门别类地收藏起来,包括你浏览过的网页、收发的电子邮件,长长的小说和深奥的文件。
Twine会按照特定的主题,比如人物、地点、组织、企业等指标分类保存,一旦用户需要查找某个信息,它就能很快地按类别搜出这个资料。当你要查找“苹果”时,它通过收藏的资料判断出您最近打算购买苹果公司生产的iPhone手机,于是它会“聪明”地列出这款手机的价格和供货商信息。
“语义网络”潜力无限
在这款软件背后,是互联网发展的一个巨大新潮流:语义网络(Semantic Web)。
所谓的语义网络,就是为各种信息加注智能标签,再把各种信息通过标签联系起来,而网络用户本身的信息也被贴上了标签,与虚拟世界相连。当一个数码发烧友在搜索框中输入“苹果”时,电脑“明白”他需要的不是“苹果示范园”和“吃苹果的七大好处”之类风马牛不相及的信息。这就是Twine所做的——充当个人资料的“电子保姆”,并在此基础上进行“个性化”搜索。
Twine并非第一个语义网络的产品或工具。多年以来,很多公司都已使用了可以自动将信息分类和检索的数据库软件。当前网络上最热的博客功能,也使用了语义网络的原理:人们在自己的博文里添加若干标签,这样在数据库里就能检索到博客的主要内容了。
纽约大学“交互式远程通讯”项目的克雷·舍基教授憧憬道:“语义网络的潜力无可限量,表面上看,语义网络只不过是一场给信息加上标签以利于检索的时尚运动,可实际上,这一运动将给机器智能带来一场翻天覆地的革命。”
机器帮你总结文章内容
据Radar Network公司创始人兼CEO斯皮沃克说,Twine的编制遵循了由国际组织万维网协会(W3C)建立的语义网络标准草案,这就意味着,Twine符合某种规范,也正因为如此,它可与其他语义网络应用程序兼容并共享信息。这大大地扩展了Twine的搜索范围。
除此之外,Twine还使用先进的机器学习程序和自然语言处理程序理解语义,这使它的认知能力远远超过了仅仅通过手工添加的标签进行搜索的系统。斯皮沃克介绍说,自然语言分析能力能帮助系统迅速“理解”含义模糊的词组——它可根据上下文来判断J.P. 摩根是人名还是一家公司的名字。更令人叫绝的是,给Twine一段文字,它能利用机器学习能力,在维基百科一类的词海中寻找匹配的信息,总结出这段文字的主题甚至概括中心思想。对此,斯皮沃克信心满满地说:“我们(的软件)会用全新的方式和手段去理解一段文字。”
我们没有夸大其辞
斯皮沃克说,人们研究了几十年的“人工智能”、“人类语言处理技术”,而今天,人们把这些研究成果运用在语义网络上,让这张网变成智能网络,能“看明白”人类的自然语言。
然而,并不是所有的人都对Twine的前景乐观。托尼·肖“语义世界”的领导人。他认为现在就断定Twine是否能够赢得客户还为时过早。仅仅是技术上的可行并不意味着成功,还要引导消费者提升对先进技术的期望值,告诉人们“我们没有夸大其辞”。
斯皮沃克介绍说,今后几个月,这款软件将会接受更多用户的测试。2008年夏季,Twine可能会完全开放。另外,Twine还会建立一个开发平台,允许程序员开发基于这个平台的程序,例如可视化软件。这样,用户可以从不同的视角搜索信息。“不过首先,我们必须从最基本的开始。”斯皮沃克说。
如果您非常迫切的想了解IT领域最新产品与技术信息,那么订阅至顶网技术邮件将是您的最佳途径之一。