知识图谱网站(知识图谱网站关闭了?)墙裂推荐
知识图谱在一个超级大的数据库中重新整合世界的信息。语音搜索功能彻底将「说话」纳入到了搜索领域。而 Google Now 能够让人们在还没来得及提问的时候就已经给了人们想要的答案。
作者介绍Steven Levy (born 1951) is an American journalist who has written several books on computers, technology, cryptography, the Internet, cybersecurity, and privacy.
还记得我们在《Kurzweil:奇点大学校长思想集》这篇文章中介绍的,在人工智能、机器人、深度学习等领域被视为奇才的Kurzweil对自己一生使命的定位吗?那就是“让机器理解自然语言”Kurzweil也说过,加盟谷歌一方面是被佩奇说服,另一方面Kurzweil觉得只有谷歌这个平台才能实现他的愿景:不断去破解自然语言的难题,变革谷歌的搜索引擎,从而影响全球几亿的谷歌用户。
那么,本文就全面介绍一下Google在这一领域所
做的努力工作,同时也是谷歌把握未来趋势的三大战略支柱:知识图谱(本文介绍)语音控制Google Now知识图谱在一个超级大的数据库中重新整合世界的信息语音搜索功能彻底将「说话」纳入到了搜索领域而 Google Now 能够让人们在还没来得及提问的时候就已经给了人们想要的答案。
知识视图的起源在 2010 年,Google 收购MetaWeb 公司的时候,大家都没怎么注意但是如今看来,当年的那次收购确确实实影响了如今搜索领域中很多重大的改进,在曾经简单的「十行蓝色链接」之上附加了丰富的类似于卷宗档案一样的内容,涉及人物、地点、物品等等,一应俱全。
MetaWeb 是当时著名的计算机科学家及创业者丹尼·希尔斯(Danny Hillis)在 2005 年创建起来的他曾经的公司叫做 Applied Minds,在这个公司丹尼·希尔斯曾经开发了很多创新项目,然而其中有一个项目尤为让他觉得意义重大,以至于准备开设另外的一家公司独立运作这个项目,这也就是 MetaWeb 公司的起源。
它于 2007 年创建该公司在当时被称之为「语意网络」中进行首次重大探索说这么学院派大家也许还是一头雾水,简单点儿来说,就是用某种方式将多个数据库进行加工,将其整合到一种格式中在这个格式下的信息会非常容易解读,就像是所有的东西都被收集打扫到一个巨大的贮藏室里一样。
希尔斯表示:「我们正在创建世界的数据库,一个能够容纳世界全部信息的地方」鉴于那个时候 AppliedMinds 已经开始扫描互联网来提供问题的解答服务,不少人认为Metaweb 都是 Google 最强有力的竞争者。
但是过了几年,该公司融资了 5000 万美金之后,希尔斯意识到他头脑中那个绝妙的、宏伟的想法只可能成为一个更加强大的公司中的一部分,它只能在那个公司的羽翼下才能破茧成蝶那个公司,名叫 Google那个时候,其实 Google 也在为问题提供一些直接了当的答案。
比如,如果你打美国总统巴拉克·奥巴马的生日,它很快就能响应,在搜索结果的最上方显示正确的日期:「1961 年 8 月 14 日」但是,当 Google 在 2010 年的 7 月份,在其博客上宣布对 Metaweb 的收购时(其中也包括收购 Metaweb 的那包括了 1200 万条容纳人物、地点、事物信息的数据库),它的搜索引擎还没有回答复杂问题的功能。
你如果打出类似的问题:「西海岸那些学费低于 3 万美金的学院有哪些?」又或者「至少获得一届奥斯卡奖,现在已经年过 40 岁的演员都是谁」,Google 是没有办法给出答案的同时,Google 在博客上向外界宣布,对 Metaweb 的收购会有助于提升这个功能,届时 Google 将会针对这种极其复杂的问题给出非常准确的答案。
Google 曾经的产品经理艾米丽·莫克斯利(Emily Moxley)接受采访时表示:「当 Google 收购了 Metaweb 的时候,Google 是非常明白收集所有信息对于搜索是多么重要的一件事。
在人们所关心的问题上,它能够给出最快的摘要和最准确的信息,这是最明智的选择,当时我们都是这么认为的」开始不断成熟的知识图谱及其背后的意义在 2012 年 5 月,Google 推出了从 Metaweb 中衍生而来的东西,它的名字就叫做 Knowledge Graph(知识图谱),它从 1200 万个条目已经暴涨到了 5 亿个条目。
这个产品会给你搜索的内容提供另外一种附加的衍生出来的结果当你搜索某些关键词后,如往常一样下面出来了很多排列好的链接,但是在最右边,它会针对你所提供的关键词给出一组信息,这些信息与你所查询的词高度相关,往往对你来说更加有用。
那么到底哪些搜索字词能够触发这个知识图谱呢?哪些搜索字词值得触发呢?莫克斯利是这么解释 Google 的做法的,她拿在维吉尼亚州,位于 Rickmond 的洲际高速公路来做比方如果是从东北方向而来,要去向弗罗里达州的游客们应该都知道,就在 Richmond 的北边,路线 95 的岔口那儿会有一个标示,告诉司机们你可以选择走南北方向的主干道,直接穿过市中心,又或者选择上 295 号线,这条线围绕城市一圈,然后再与 Richmond 南边的 95 号线汇聚起来。
具体到搜索领域,当你开始查询一个字词,Google 会将其扩展为具有高度相关性的一组字词还有同义词,然后对这些衍生出来的词语进行一次算法测试,看是否符合知识图谱上的结果这就相当于提前在 295 号线上转了一圈,在选择 295 号线还是 95 号线的时候,系统已经给出了最具价值的路径,如果绕着 295 号线能看到更多有趣的风景,那么系统自然会给你呈现出知识图谱的相关内容了。
自 Google Search 将知识图谱完全整合进来之后的两年多的时间里,公司一直持续地改善这款产品当然,Google 官方并不会说搜索字词到底有多少的比例会触发知识图谱的内容,但是大致上我们可以估计得出来应该起码有 25%。
一开始,知识图谱只是一些简单的数据,但是这个产品开始不断的自我进化,复制了Google Search 中自我学习功能,开始分析用户的上网习惯举个例子吧如果你询问:「谁在《星球炮弹》这部电影中扮演了 Barf 这个角色?」因为系统已经在你发问之前看到无数人都提出类似的问题,它就会自动给出一个图表,里面有演员的姓名 John Candy,电影名称还有演员的照片。
你也可以自己去试试这个把戏,打出「某部电影里的某个角色是谁扮演的?」看看系统是多么快地给出答案知识图谱同样还在另外一个重要领域带来进步那就是信息的及时性鉴于 Google 往往是对一个问题仅仅提供一个正确的答案,那么这唯一的一个答案一定要保证是最新出现的,否则它就不可能称之为最正确的答案。
由于信息的不及时所导致的后果,还不如用户压根不去搜索莫克斯利表示:当知识图谱在 2012 年第一次出现之前,大众汽车如果决定聘请一名新的 CEO,系统估计需要两个星期的时间才能把这个消息反馈在互联网上;而如今知识图谱的出现,整个系统在处理接收这些新闻,做出及时调整上只需要几分钟就能做到。
但是知识图谱并非能够满足所有人的需要信息传递时也会出现误差比如大众公司已经决定聘请某某成为新 CEO,可是这哥们儿在后面的几个月一直没有到位入职,所以知识图谱所显示的仍然是现任CEO 的信息,这对于很多想要查找新 CEO 信息的人们来说就极为不方便。
除此之外,知识图谱还在不断增加新的知识领域最近它将汽车领域、视频游戏领域、雨果奖获奖人员信息全部纳入其中Google 不仅仅满足于向人们提供简单的事实,它已经不再仅仅是追求更快的搜索相应速度,给出一些高度相关的信息,它要给出更加复杂,高度集合化的搜索结果。
莫克斯利表示:「人们往往关心的不仅仅是事实本身他们更关心一些主观的意见看法比如这个电视剧是不是好看这些意见会让知识图谱更上一层楼的」这样做,似乎 Google 是不想让你觉得它只是一个随手一番的字典或者查询极其,它更想扮演一个天上地下无所不知的先知,不仅仅是了解天文地理这些客观的知识,不仅如此,这个先知还精通人世间所有的文化。
知识图谱目前也是存在短板和缺憾的但是知识图谱还有相当长的路要去走大家从知识图谱上所获得的满足催发出了更高的期待值,然而这些期待不断落空,转化成失望和沮丧莫克斯利就曾经非常气恼,因为她发现知识图谱虽然知道某个电视剧,但是它却不知道这部电视剧最新季的信息以及它们什么时候会播出。
她说:「我其实就是想要它给我一个提醒,告诉我本周我所喜欢的电视剧的新集开播啦!我同样也想知道在哪个网站能看到它但是目前知识图谱还做不到」不过她表示最终 Google 能彻底解决这些问题说到令人失望的部分,估计还有曾经提到过的 Google 信誓旦旦所做的保票。
它曾说:以后你只要提出诸如:「西海岸那些学费低于 3万美金的学院有哪些?」又或者「至少获得一届奥斯卡奖,现在已经年过 40 岁的演员都是谁」这样的问题,Google 能给你一个圆满的答复但是直到四年之后的今天,Google 仍然没有办法做到这一点。
知识图谱能带来什么谷歌两年前正式推出被称为知识图谱(Knowledge Graph)的新搜索功能只要在谷歌搜索引擎里键入单词或短语,在传统搜索结果的右侧就会多出一个栏目直接显示该词条的相关信息,这些信息来自维基百科与其他提供信息服务的网站。
与之前的浏览方式相比,用户免去了自己访问信息出处网站这一过程——谷歌直接把信息呈现在搜索页面中站在用户的角度,谷歌的创新的确提供了更加快捷的搜索体验——只需轻轻一敲,信息尽在眼前不过需要点击量的网站们听到这个消息肯定开心不起来了。
知识图谱的出现给他们的生存带来了威胁,甚至对现存互联网产业的商业模式造成了冲击可以预测,知识图谱将导致一系列网站关门,而网站的减少又将造成网络信息的流失信息是网络的基石,谷歌此举究竟会带来什么呢?技术进步
知识图谱仅作为一项新功能,就已经收录了约5亿个词条,信息量也已达到35亿条,而且这个数据还在不断地膨胀对于一个语义搜索引擎而言它的确足够强大,老牌语义搜索引擎维基百科只有3000万个页面,相比于谷歌足足少了一位数。
功能推出后的谷歌搜索搜索结果分为左右两个部分,左侧是传统的搜索结果,右侧是知识图谱功能提供的语义信息 谷歌搜索布朗克斯动物园,在右侧会出现动物园的相关信息在搜索结果新增的右侧,谷歌给出了一张布朗克斯动物园的地理位置图,地图下方是对动物园的基本描述。
描述的右下角标注了维基百科的链接,表示此条信息选取自维基百科在基本描述之外谷歌还列出了布朗克斯动物园的一些玩点与看点与传统搜索结果中的第一条——动物园官方网站相比,这些信息还是略显单薄但对于那些没有官方网站的词条而言,这样的信息应该算是很具参考价值的了。
(1)谷歌 Vs. 必应:不同的发展之路在谷歌利用互联网上的已有信息把自己打造为一个语义搜索引擎之际,微软的必应在做着另一方面的尝试——把搜索引擎和社交网站结合起来必应试图从用户的社交网络中提取信息以做出更加全面的回答。
只要用户登陆Facebook时激活必应的工具栏,必应便会从Facebook内的好友主页中拉取信息,显示在搜索结果中比如用户通过必应搜索某一景点,它就会显示出好友相册里关于该景点的照片;搜索某一部电影,它就会显示出好友对此影片的评论。
不过这项功能还有待完善,有用户反应自己在搜索地名时获得的信息却是“几百年没见的老朋友曾经居住在距离此地100英里(约161公里)外的地方”,而搜索印度泰姬陵景区时弹出的却是名为“泰姬陵(Taj Mahal)”的音乐家最近新开了博客。
相比谷歌,必应的新搜索功能还是落在了后头它着眼的社交搜索功能不仅需要用户在Facebook上有足够数量的好友作为支持(好友数越多信息量越充足),而且暂时还无法给出令人满意的结果就搜索布朗克斯动物园为例,必应大概只能拉取出Facebook上好友在该地的照片,或是某某好友曾在纽约州(布朗克斯是纽约州的一个市区)居住过,这些都不具备足够的参考意义。
必应的另一个新功能是“咨询亲友”,当用户进行搜索时可以选择“咨询亲友”选项,向自己所有Facebook上的好友同时发问,不由得让人想起了开心辞典目前该功能也没有完善,用户只能向所有的好友一起发问,不允许主动选择范围人群。
谷歌旗下也有“Google Circles”(由Google+发展而来)这一社交产品对于谷歌是否也会发展出自己的“咨询亲友”功能还很难说,不过笔者相信,让用户有选择咨询对象的能力,是这项功能不变的核心谷歌也在把社交网络与搜索引擎相结合起来的方向做了尝试,并推出了Search Plus Your World。
和必应的社交搜索功能相比,它的不足点在于没有把传统网络搜索结果和社交网络搜索结果分列显示,这给用户造成了不必要的麻烦有用户有时只想搜索新内容,却不得不在搜索结果中重温社交网络中的言语图片必应在此方面做得更好,它把两者分而处之,给用户提供了更大的自由空间。
(2)行业冲击与信息垄断回到谷歌知识图谱对互联网产业的冲击这一话题知识图谱功能确实损害了信息来源网站的利益,谷歌正在把网络上的信息一步步地搬到自己的数据库中(正如它已经对维基百科进行的侵蚀与同化),用户们逐渐不用再点击信息来源网站进行访问。
而点击量对于网站而言意味着价值,维基百科依赖着用户的使用才获取了关注及捐款点击量的下降必将导致网站提供信息量的下降,这种上层建筑侵蚀下层基础结构的不稳定性不用多说如同触尾即毙的贪吃蛇,问题迟早会浮出水面。
谷歌对于这个质疑也给出了自己的回答,谷歌搜索业务的高管艾米特·辛格尔(Amit Singhal)对此话题给出了回应他指出,搜索引擎的技术进步将扩大使用搜索引擎的总人数,而扩大的用户基数将给网站带去更多的访问量。
辛格尔回避了这样一个事实:谷歌此次的新功能与他所言及的技术进步不同之前谷歌在搜索引擎上所做的努力在于如何将搜索结果定位到更加满足用户需求的网站,而现在他们改变了用户习惯——用户不用再去访问网站了所以无论这个基数有多大,网站方都不会看到自己想要看到的结果。
辛格尔还回应道,网站方与其指责搜索引擎的进步,倒不如在自己身上下工夫,提升自己的价值,而不是只回答搜索引擎就能搞定的问题在他举出的例子里,这个“搜索引擎就能回答的问题”是“2加2等于几”很明显,谷歌和辛格尔都没有在严肃地对待这个问题。
至今没有人能够指出谷歌的边界在哪里,也许只有技术瓶颈能够成为他们的障碍不过这倒是给整个互联网行业提了个醒——只要能提升自己的服务、为自己创造价值,谷歌绝不手软用谷歌搜索“全球变暖”,右栏出现的是一个支持者和一个反对者。
假设谷歌的知识图谱完全成熟,它将涵盖地球上所有书籍以及网站上的内容信息也就是说,它将具备信息垄断的能力届时假设有一个网站对于“气候变化”和“知识产权”这样颇具争论性的问题拥有一个不同于常的论点,此时用户们使用谷歌的搜索引擎就无法找到它。
历史经验无数次告诉我们,一旦有机构能够代表权威,它就有能力扼住信息的咽喉令人担心的是,谷歌把自己定位为信息的权威方,而不是一个互联网信息搬运工的角色同时,它仅仅把这种权威的身份赋予自己——只有谷歌有能力对知识图谱上的内容进行判断和修改。
老牌语义搜索引擎维基百科对自己的定义是“自由的百科全书”,主张“动态、可自由访问和编辑”的理念但谷歌不是这么想的,它把这扇门向公众关闭了本文来源:Medium相关文章:《谷歌知识图谱:搜索的未来是提供答案(2013)》
以上内容来源于网络。如涉及版权,版权归作者所有。
免责声明:本站所有信息均搜集自互联网,并不代表本站观点,本站不对其真实合法性负责。如有信息侵犯了您的权益,请告知,本站将立刻处理。联系QQ:1640731186