模式识别技术下一步怎么走?
出乎意料地,陈波说团队面临的最大困难竟是”用户对人工智能(模式识别)的期待“。 “很多功能都很好,用户会问为什么不能实现”,陈波说到,“我们做的事情是模仿人的大脑,但人脑神经网络非常复杂,目前的人工智能远不能匹敌,用户对它的期望很高,需要做引导,让用户理解”。卢鲤举语音转文字(5.0 的“语音输入”)的例子,“这相当于一个初中生脑袋能干的事情,现在要让机器去完成,是比较有难度的”。 陈波认为虽然短期内麦克风、摄像头和其他传感器可能没有大的爆发点,但长期来看,它们一定会非常重要。“摄像头、麦克风的应用仅仅刚开始,看起来很火,但与大脑相比,差得好远”,陈波充满信心,“比如穿戴设备,由于没有很好的传感器,还没有被引爆。但是科技潮流的发展方向是不可逆的,它一定会在某个时间点爆发”。 拿眼下的麦克风和摄像头这类“入口”来说,在移动互联网之前,它们是安防领域的标配,到了移动互联网就成为移动设备的标配。“标配是干吗的?还不是让人的生活更方便嘛。标配就有可能成为入口。”不过陈波认为语音识别或图像识别领域都还处于发展初期,无法成为替代性的东西;她说将来也不可能完全替代现有交互方式,只是所占比例会越来越多,比如 Google 就已有超过 10% 的搜索就来自语音搜索。 模式识别中心图像组组长刘海龙举了一个例子,拿图像识别领域的视觉搜索来说,除了完善现有的 5 个“扫一扫”功能的库容量外,将来也可以扫描三维刚性物体,或由商家自定义用户想找到的东西——类似于 Google Glass。这是微信的重要产品理念:所见即所得。在刘海龙看来,摄像头应该是视觉的延伸,“它就是我们的一双眼睛”。 (微信模式识别中心图像组负责人刘海龙) 我问陈波微信加入各种功能,包括模式识别技术领域的功能,会不会变得越来越臃肿?她说微信的基本格局一直没有变,只是在各种入口之下,承载了更多东西。“不是臃肿,而是添加了更多创新的东西,很多用户喜欢。”她举的例子是摇一摇搜歌,“一开始的时候我们还没有信心,这个功能也做得很隐蔽,但是后来增长曲线很健康,认可度和好评度都很高”。陈波说这个功能每天的服务次数在千万次级别,大约有 10% 的人搜到歌曲后会去分享。这是一个不错的分享比例。 至于人工智能可能的发展方向,比如 20 年后会是什么样子?陈波笑称把想象空间留给好莱坞的科幻电影。“钢铁侠、碟中碟 4 中有大量语音、图像识别技术,对未来产品形态作了某种诠释”,陈波会带着团队集体去看这类科幻电影,“期待有一天真的达到那个效果”。
|
来源:即时通讯网 - 即时通讯开发者社区! |