专和小朋友对话的人工智能:ToyTalk和它背后的技术_智能_好奇心日报

夏雨青 2014-09-28 16:45:16

ToyTalk 专门开发面对小朋友的智能语音。它有三个应用,都又萌又温暖。它是怎样超越传统语音识别,试图去理解并和孩子们交流呢?

语音识别已经不是什么新鲜技术了。TTS 技术发展了几十年,苹果、Google 和微软三大巨头纷纷推出语音搜索和语音助手功能,微信上也可以用语音做很多事。除了准确度还需要改善,还不够智能,关于语音技术还有什么新话题呢?

这家专门面向孩子的智能语音平台公司 ToyTalk 还真不太一样。

据 Wired 报道,ToyTalk 由皮克斯前 CTO Oren Jacob 及 Martin Reddy 创建。他们目前推出了 3 个应用:Winston Show,SpeakaZoo,和刚刚发布的 SpeakaLegend。

这三个应用的共同点是,它们引导孩子与屏幕上的虚拟形象互动。SpeakaZoo 让孩子管理一个动物园,与园里的动物交谈。SpeakaLegend 的交互对象是传奇中的龙和仙女等等,除了语音互动,还加入了触控操作。


让孩子们长久地维持注意力、沉浸在 ToyTalk 想要营造的卡通幻想世界中并不容易。为了知道他们在说什么、怎么回应,ToyTalk 开发了 PullString 系统——一个包括语音识别引擎和剧本写作的工具。

孩子们的声音更尖,变化更多。他们的句子结构并不完整,叙述也时常很混乱。传统语音识别工具并没有为这些特殊设计,因而识别准确率很低。我们在用 Siri 这样的语音助手时,常为了便于理解而说一个完整的句子。孩子们可管不了那么多。

PullString 的语音识别构建于传统的识别技术之上,但用他们自己的数据进行分析。根据 Wired 的消息,Toytalk 现在有一个庞大的数据库,容纳超过两千万个孩子的呓语。这可能是全世界儿童语义数据库中最大的。随着他们收集数据的增多,PullString 也会变得更智能。


除了 PullString 的技术支持外,让孩子们持续地感兴趣并且发挥创造力的关键还在于怎样引导与孩子们的交流。为了尽可能多地收集小用户们的问题和回答,他们在湾区举办了长期工作坊,鼓励家长带孩子们来试玩系统。一开始 Oren 本人甚至会扮演角色,只为了看看孩子们可能会有什么反应。

最后他们把所有收集到的信息贴在墙上,再请写手针对这些对话进行剧本写作。 

这是个现在看起来有点笨拙,却最适合小朋友们的办法。当人工智能还达不到我们需要的“智能”程度,坐在屏幕另一边的有可能是一个真实的人——这个场景有点荒谬,又有点温馨。

最为 ToyTalk 感到兴奋的是那些不知道该怎么在移动平台上发展的玩具商和动画制作人。语音识别公司 Nuance 的前 CCO Gary Clayton 是 ToyTalk 的顾问。他接触到的很多需求方说,“我们有这么多角色,也知道移动平台是未来的重地。但我们既没有你们的专长,也没有你们开发的平台优势。” ToyTalk 的实现方式赋予了虚拟角色性格和灵魂。

Orbe 的女儿 Toby 七岁了,她的好朋友是 American Girl 玩偶娃娃。其实 ToyTalk 背后的技术没有那么复杂, 不过你随时能体会到它对孩子的关心、理解和鼓励。这是引导技术的人所要做的事。

来听听 ToyTalk 上一些孩子们的呓语吧,真的很温暖呢。

喜欢这篇文章?去 App 商店搜 好奇心日报 ,每天看点不一样的。