谷歌教你如何打造聪明的聊天机器人

谷歌教你如何打造聪明的聊天机器人

一般情况下,我们和电脑说话都觉得很费劲,因为它们有点望文生义。但是,谷歌正在教电脑如何理解人类语音和文本的博大精深。

现在,谷歌把其算法开放给第三方的软件开发人员。有了这些工具程序员就能开发基于语言的应用和服务,比现在许多的聊天机器人更加善解人意。而程序员大概会迷上谷歌正在完善的强大机器学习技术

谷歌对语法和句法的掌握有助于其提供更准确的搜索结果,而且会随着越来越多的设备和服务都依赖于语音控制变得越来越重要。

基于谷歌软件的智能手机已经可以声控,而且谷歌正在开发类似于亚马逊Echo的家庭设备,它很大程度上依赖语音交互。所以谷歌开放工具,使语言理解更容易有很大的战略意义。

“我们的大多数用户都通过语言与我们互动。”谷歌自然语言理解和机器学习的领导人Fernando Pereira说。 “他们通过打字或说话来问问题,所以,为了让用户满意,我们必须使系统了解用户想要的是什么。”

谷歌还发布了名为SyntaxNet的工具,可以基于其上下文背景和普遍使用学会理解单词和短语的意思。它适用于谷歌原先发布的名为TensorFlow的深度学习框架,同时,它还是迄今使用TensorFlow构建的最复杂和最精密的部件。

谷歌还发布了英语预先训练解析器,称为Parsey McParseface(一发言人称,该公司在帮它起名字时很困扰,直到有人建议这个琅琅上口的名字)。文本被送入分析器后会自动分解成这样的句法成分:如名词,动词,主体和对象。这使得计算机更容易正确解析不明确的查询或命令。

谷歌通常依赖于数据机器学习,当然的确有些其他的方法,如Facebook试图通过提供大量未标注主要数据计算机,从而培养它们解析语言的能力。但是,谷歌的语言理解项目,是专业人士建设的。八年多来,语言专家一直在努力为谷歌注释文本。而最近这些标注在大型深度学习神经网络取得了很大进展。

对计算机而言,理解语言是非常困难的,因为语言往往是模糊的。即使是像“Find me cats in hats”一样简单的搜索查询,也会出现歧义,可以解释为带帽子的猫或者坐在帽子上的猫。人类可以使用常识来辨别这样歧义的句子,而谷歌的技术则是采用机器学习。其深度学习系统,通过语法文字的培训,判断出最有可能正确的语句结构。而在刚才的“cats in hats”例子里,谷歌会假定搜索者感兴趣的是时尚前卫带帽子的猫。

谷歌产品经理Dave Orr,负责寻找语言理解研究的商业应用,向外媒记者展示了该技术。他把几篇MIT科技评论的文章放进内部版本的语言解析器。它犯了几个微不足道的错误,但总体来说其注释的准确性令人印象深刻,能正确识别句法结构或捕获标题的含义。 “这是人类能创造的最好的解析器,”奥尔说, “我们认为这是接近人类的水平。”

在内部,谷歌结合了自然语言系统和称为知识图谱的语义信息数据库。这使得它能够识别特定对象,人物,地点等概念,并作出相应的反应。该系统通常也能够通过将单词与出现在一个类似的上下文比较,正确将新单词分类。迄今为止,该技术适用于15种语言。有些语言对语言分析更有挑战性,培训起来更加困难,奥尔说。

然而,该技术远远还没能够完全理解英语。 “我们的系统在结构合理,精心编辑的文本表现得最好。”Pereira说, “社交媒体和搜索查询的不规律更有挑战性。我们已经取得了进展,但有很多的空间。”

仍然有很多歧义的地方需要人类程度的常识——我们从经验中学习的东西,从我们的朋友和我们的父母得到的建议,”Pereira说。 “这种丰富的解决问题能力正是我们系统的缺失。”

研究语言理解的斯坦福大学教授Noah Goodman说,改进语法的理解仅仅是电脑需要掌握语言的开始。 “语法肯定是语言的重要组成部分,”他说。 “但是,从语法到语义学;从浅层语义到推断深层含义都是很大的进步。”

via TR

发表评论

电子邮件地址不会被公开。