机器人

图灵机器人郭家让机器人理解世界 它能做什么

【网易情报讯4月13日消息】猎云网2017人工智能产业创业创新峰会今日在北京四季酒店举行。 人工智能领域的著名学者、顶尖专家和知名投资人将参与讨论当今人工智能的发展、创新和变革,将产业与人们的实际应用相结合,为人工智能的普及奠定可行的基础。

从一个工具到一个系统,成立六年的图灵机器人又开始聚焦应用。 在今天的峰会上,图灵机器人郭嘉为企业家和人工智能爱好者分享了《机器人操作系统、多模态语义与人工智能新趋势》的演讲。

提到了深度学习、机器人交互的应用等,并提出算法+数据=模型。 指出图灵将会在AI算法上向社区贡献自己的算法,国外的一些数据也会被共享。 所以每个人都能找到算法,所以区别就在于算法。

郭在会上用两个例子来描述消费级机器人可以做什么。 其中之一是美国的BLUE RIVER公司。 他们设计的机器人是一个放置在拖拉机后面的注射器,不仅可以帮助人工处理杂草,还可以帮助农作物更好地生长。 另一家是日本公司,名为TWENDY ONE。 它的成本很高,但它的作用只是帮助老人捡起掉在地上的吸管。 功能和成本不匹配。

因此,图灵想做的是一个有情感的机器人。 机器人用手和头表达情绪,用眼睛的颜色表达情绪。 通过语义传达情感,并以硬件的形式表达出来。 换句话说,消费级机器人应该更实用、更有情感传达。

最后,郭佳还详细介绍了家庭机器人和教育机器人的研发以及生活场景的应用。

以下为郭先生讲话实录,经猎云网编辑整理:

今天给大家分享的是AI的一个领域,就是多模态交互。 因为我们都知道人工智能是一个很大的门类,里面有很多学科。 比较流行的是机器学习和深度学习。 深度学习就是算法+数据=模型,然后训练各种场景。 我们做的场景主要是机器人交互。 图灵一直专注于语义技术,我们的理念是让机器理解世界。 中国人人都知道图灵是最好的聊天机器人。 如果有人说图灵的东西是因为算法好,我只能说他们没有找到专业的人。 我们会找到当前领域的大部分算法或者95%以上的算法。 如何找到它? 我们向开源社区贡献了许多算法。 包括斯坦福、麻省理工等在内的众多国内外学者和大学也将分享最新算法。

大家都说算法是可以找到的。 有什么不同? 我认为差异主要体现在数据上。 我刚才提到了算法+数据=模型。 我们图灵机器人其实从2010年就开始积累这些数据,2014年我们正式开放,面向企业和开发者。 从2014年底到现在,已经有超过40万的开发者,他们不断地给我们贡献数据,他们是我们的合作伙伴。 这类数据对我们来说有特殊的意义,因为我们主要做语义,我们积累的数据是语料库和知识库,它们是我们用来训练我们的语义模型的。

我们应用到一个场景,消费机器人,那么消费机器人能做什么呢? 我为什么要发布这样的图片? 我们所说的人和动物最大的区别是什么? 我在初中历史书上了解到,人类和动物最大的区别是人类可以制造工具,而人手和动物最大的区别是人类可以制造工具。 人为什么要直立行走? 因为人的手制造工具,而不是像动物一样爬行。 我们把它放到机器人身上,想一想机器人的手能做什么。 我们发现了很多场景和案例。

这家公司叫 BlueRiver,是我喜欢的一家初创公司。 这家公司很有趣。 据说我的机器人只是一个注射器。 该注射器放置在拖拉机后面。 这款机器人可以自动帮助人们完成杂草的处理。 怎么处理呢? 将肥料注入杂草中以杀死它们。 这个概念既环保又节省劳动力。 他说,去年的目标是做生菜,今年的目标是做西红柿和土豆。 这就是该公司自定义的机器人的样子。

下面的例子是日本的老年护理机器人二十一。 这款机器人的售价约为100万元。 哪里贵了? 我们看到底盘是轮式的,主要是它上面的机械结构,从传感器到各个部件,是最贵的部分。 这个机器人就是一个反例。 首先它太贵了,其次它的机械臂价值很小。 在这个促销活动中它能起到什么作用? 老人的吸管掉在地上,可以捡起来,也可以帮助老人下床,但这些应用场景都不是很实用,在这个价位上效果也不是特别大。

那么回到之前的问题,消费机器人能做什么? 如果说人类与动物的区别在于制造工具,那么目前机器人的手臂在我们看来似乎无法做任何有价值的事情。 在消费领域,机械臂的成本太高,能完成的事情太少,所以我们就有了这个新的思考。 这是Robohon,我们和富士康合作的机器人。 该视频显示两个机器人正在聊天。 他们聊天时,先用手和头来表达自己的感受,再用眼睛的颜色来表达情绪。 在语义过程中,我们将我们所识别的情感和我们想要表达的动作传递给富士康机器人,以便它们能够传达。

我们还发现了另一件事。 机器人的手臂在表达情感方面也发挥着非常重要的作用。 因为我们了解人的手。 比如我现在说话的时候,我的手就会做出这样的动作。 为什么我会做出这样的动作? 其实和语义有关。 比如说我有一个月饼,把它切成两半,你一半我一半,我从月饼到切一半的每一个动作,这些动作都和语言有直接关系。 动作表达最基本的就是理解这句话的意思。

这就是梅拉比安模型。 我们可以看到,大部分是通过肢体和声音来传达的,而不是通过语言来传达的。 如果靠语言的话会很累。 有记者曾采访过Robohon的发明者。 记者问您认为机器人和人类最大的特点是什么? 他说机器人会说话。 记者表示,这款手机还有Siri。 他说你见过人跟金鱼说话吗? 和乌龟说话? 打电话吗? 他认为我们为什么要与动物交流? 例如,狗为什么要与它交流? 它不会说人类的语言,主要使用身体动作。

这是一个统计数据。 白色部分是一款创新的家用消费机器人。 该机器人尚未上市。 另外一个就是我们和奥飞合作的机器人超级飞侠。 这两款机器人给用户带来的体验以及与动作表情的交互次数和喜好要高得多。 目前,从多模态交互技术来看,图灵也是国内唯一提供该技术的公司。 我们一直在研究语义。 在做语义的过程中,我们发现语义可以这样使用和传达,而且可以不用文字来传达。 传达。 这是另一个应用场景。 我们与腾讯的合作是三月份才开始的。 现在大家都打开QQ群了。 如果群主启用了功能性聊天机器人功能,则只需要关联一个机器人即可,该机器人是图灵机器人制作的。

这是什么英语场景? 我们和名人或者有IP形象的人合作,比如孙悟空、爱因斯坦。 我们如何与他们合作? 我们制作一个以个性为内容的互动机器人。 目前我们还与多位名人合作制作适合他们个性的机器人。 当然,这个机器人的聊天内容可能与其他机器人不同,因为它面对的是粉丝。 那么粉丝们通常会问的问题就是,周杰伦在家穿什么颜色的拖鞋? 或者你喜欢狗吗? 或者你觉得蔡依林怎么样? 这是粉丝提出的问题,其功能与刚才提到的实际机器人有所不同。

另一个应用场景是教育机器人,这是耶鲁大学的一份研究报告。 我们可以看到,左边第一张图是一个给孩子玩的游戏,或者是边学习边回答问题、学习单词。 第二个是在屏幕上放一只小黄鸭,这只小鸭子可以发出声音,是小鸭子在学习过程中回答正确的时候给他鼓励,小鸭子告诉他这道题该怎么做如果他回答错误。 最后一个是实体鸭子。 这只鸭子不仅会说话,还会动并给他反馈。

最后,从学习效果的角度来看,我们看到机器人的最后一种方式是最高效的学习方式。 一开始很多人不理解,包括很多家长,说我很难让孩子学习的时候把一个好玩的东西放在身边。 但耶鲁大学的报告向我们展示了不同的结果。 这就是动态交互的力量。 我的分享就这些了,谢谢!