默认
即时通讯网 资讯 独家采访微信团队:谁在用人工智能武装微信?
即时通讯网 首页 资讯 查看内容
想开发IM:买成品怕坑?租第3方怕贵?找开源自已撸?尽量别走弯路了... 找站长给点建议

独家采访微信团队:谁在用人工智能武装微信?

52im.net · 10 年前 | 阅读(48161)· 评论(1| 来源 51CTO 转发 收藏

摘要 微信 5.0“扫一扫”发布的时候,被讨论得最多的是它所承载的商业化重任。被忽视的,是背后的技术,及技术蕴藏的趋势。同样地,这个版本亮相的微信自主研发语音识别技术,也为外界所震惊和质疑。
模式识别技术下一步怎么走?

出乎意料地,陈波说团队面临的最大困难竟是”用户对人工智能(模式识别)的期待“。

“很多功能都很好,用户会问为什么不能实现”,陈波说到,“我们做的事情是模仿人的大脑,但人脑神经网络非常复杂,目前的人工智能远不能匹敌,用户对它的期望很高,需要做引导,让用户理解”。卢鲤举语音转文字(5.0 的“语音输入”)的例子,“这相当于一个初中生脑袋能干的事情,现在要让机器去完成,是比较有难度的”。

陈波认为虽然短期内麦克风、摄像头和其他传感器可能没有大的爆发点,但长期来看,它们一定会非常重要。“摄像头、麦克风的应用仅仅刚开始,看起来很火,但与大脑相比,差得好远”,陈波充满信心,“比如穿戴设备,由于没有很好的传感器,还没有被引爆。但是科技潮流的发展方向是不可逆的,它一定会在某个时间点爆发”。

拿眼下的麦克风和摄像头这类“入口”来说,在移动互联网之前,它们是安防领域的标配,到了移动互联网就成为移动设备的标配。“标配是干吗的?还不是让人的生活更方便嘛。标配就有可能成为入口。”不过陈波认为语音识别或图像识别领域都还处于发展初期,无法成为替代性的东西;她说将来也不可能完全替代现有交互方式,只是所占比例会越来越多,比如 Google 就已有超过 10% 的搜索就来自语音搜索。

模式识别中心图像组组长刘海龙举了一个例子,拿图像识别领域的视觉搜索来说,除了完善现有的 5 个“扫一扫”功能的库容量外,将来也可以扫描三维刚性物体,或由商家自定义用户想找到的东西——类似于 Google Glass。这是微信的重要产品理念:所见即所得。在刘海龙看来,摄像头应该是视觉的延伸,“它就是我们的一双眼睛”。

(微信模式识别中心图像组负责人刘海龙)

我问陈波微信加入各种功能,包括模式识别技术领域的功能,会不会变得越来越臃肿?她说微信的基本格局一直没有变,只是在各种入口之下,承载了更多东西。“不是臃肿,而是添加了更多创新的东西,很多用户喜欢。”她举的例子是摇一摇搜歌,“一开始的时候我们还没有信心,这个功能也做得很隐蔽,但是后来增长曲线很健康,认可度和好评度都很高”。陈波说这个功能每天的服务次数在千万次级别,大约有 10% 的人搜到歌曲后会去分享。这是一个不错的分享比例。

至于人工智能可能的发展方向,比如 20 年后会是什么样子?陈波笑称把想象空间留给好莱坞的科幻电影。“钢铁侠、碟中碟 4 中有大量语音、图像识别技术,对未来产品形态作了某种诠释”,陈波会带着团队集体去看这类科幻电影,“期待有一天真的达到那个效果”。

即时通讯网 - 即时通讯开发者社区! 来源: - 即时通讯开发者社区!

相关阅读

什么狗屁云 8 年前
看起来很高大上的样纸。我不是指的这帮猥琐的程序员吊丝,说的是技术,哈哈

返回顶部