当前位置: CNMO > 新闻 > 正文

苹果看了想打人 智能AI下个风口竟是...

CNMO 【原创】 作者:廖子涵,许华 2017-12-04 06:00
评论(0
分享


苹果看了想打人 智能AI下个风口竟是...

  之前笔者一直在思考,人工智能究竟是什么?最完美的表现是不是像《攻壳机动队》里的素子一样,成为人工智能最终标志?

      不会,个人认为,在聊智能AI之前还是要说一下机器人学三大法则,必须要遵守:

  阿西莫夫的《我,机器人》,在1950年末由格诺姆出版社出版。虽说这本书是“旧稿子”,但是这些短篇是在十年间零零散散发表的,这次集中出版,使读者第一次领略阿西莫夫机器人科幻小说的魅力。阿西莫夫为这本书新写了《引言》,而《引言》的小标题就是《机器人学的三大法则》,把“机器人学三大法则”放在了最突出、最醒目的地位。

第一定律:机器人不得伤害人类个体,或者目睹人类个体将遭受危险而袖手不管。

LawⅡ:A ROBOT MUST OBEY ORDERS GIVEN IT BY HUMAN BEINGS EXCEPT WHERE SUCH ORDERS WOULD CONFLICT WITH THE FIRST LAW.

第二定律:机器人必须服从人给予它的命令,当该命令与第一定律冲突时例外。

LawⅢ:A ROBOT MUST PROTECT ITS OWN EXISTENCE AS LONG AS SUCH PROTECTION DOES NOT CONFLICT WITH THE FIRST OR SECOND LAW.

第三定律:机器人在不违反第一、第二定律的情况下要尽可能保护自己的生存。

  虽然这三条法则仅仅是在1950年对机器人下的定义,但不难看出,这“机器人学三大法则”可看做是现阶段智能AI定义的“起草书”,对后续AI智能发展有明确的指导意义,从发展来看,人类也在小心摸索前进。

《机器姬》电影截图
《机器姬》电影截图

  因此笔者也查阅相关资料,整理概括了现在人工智能的定义:人工智能就是属于计算机科学的一个分支,而在这一方面里,智能的实质就是与人类智能相似的方式做出反应的智能机器,这种研究包括机器人、语音识别、图像识别、自然语言识别处理和专家系统。

      理论和技术逐渐成熟,应用领域也逐渐扩大,但参考今年的行业形势,不论是机器人还是图像识别等技术,暂没有成型的产品出现,现阶段让消费者感受最深的也只有语音交互技术而已。

2017年什么最火 必然是智能语音交互

  如果问数码爱好者一个问题,科技圈2017年什么技术最火?

      这个问题或许会难倒不少人,因为可以选择的方向太多了。从全面屏,到电动汽车,再到人工智能,都在今年有了一个大发展。

《攻壳机动队》素子用声纹技术直接同意文件签署
《攻壳机动队》素子用声纹技术直接同意文件签署

      这些技术在发展同时也带来了一些问题。例如:全面屏手机似乎并没有像行业预期那样成为大家换机的欲望点;电动汽车虽然充电技术上有了很大改观,但是作为基础配件的充电桩却依旧在数量上不能满足需求。

《攻壳机动队》素子用声纹技术直接同意文件签署
《攻壳机动队》素子用声纹技术直接同意文件签署

  2017年有非常多大热的人工智能新平台出现,例如:人工智能手机、无人驾驶汽车、智能音箱等,都让科技圈热闹非凡。人工智能手机目前仅苹果和华为内置的协处理器在图像识别、AR技术上算智能;无人驾驶汽车虽然很久之前就提出过,但是经过几年发展,技术并没有成熟。

  但智能音箱的发展却是实实在在、看得见摸得着的。2017年,几乎所有与人工智能有关系的科技公司都在语音交互上做文章,而智能音箱作为实际载体,也让更多消费者体验到科技魅力。

      借着这个热度,这期就给大家聊聊人工智能语音交互。

人工智能一大风口:和声音有关的那些事

《攻壳机动队》
《攻壳机动队》

  看过《攻壳机动队》电影的小伙伴应该不陌生里边的素子,语音识别控制各种协议签订可以说是最酷的行为。语音识别可以说是目前我们可以感受到最近的技术。从Siri到今天日益盛行的智能音箱,从上游技术到下游产品,“智能”这个词一直在反复强调。

苹果Siri
苹果Siri

  其实Siri那一套就是自然语识别:ASR(automatic speech recognition,自动语音识别)+NLP(nature language processing,自然语言处理)+TTS(Text To Speech)。语音识别和自然语言理解都是Siri中必不可少的部分。  

语音识别基本流程
语音识别基本流程

  语音识别实现的是从语音到文字的转换。语音对于电脑来说,就是对声音每秒n次采样后的一组二进制流,电脑无法理解其含义。只有将语音识别成文字,电脑才能进行后续的处理。    

高通Qualcomm智能语音解决方案
高通Qualcomm智能语音解决方案

  自然语言理解实现是文字的理解。比如电脑收到文本“今天天气怎样”,理解后会返回“今天下午下雨”类似的结果。 通常最简单的做法是收集大批的人工问答集合。比如抓取知乎、百度知道等人工回答的问答集,并进行处理。对于用户输入的问题,则会在这些问答集里的问题里进行搜索匹配,找到相关度最高的,将问题的答案返回给用户。


智能语音硬件 或将是未来AI智能发展方向

  其实Siri不管之后怎样进行升级,还是由 Nuance提供的技术:Nuance公司(Nuance Communications, Inc. (NASDAQ: NUAN)) 是最大的专门从事语音识别软件、图像处理软件及输入法软件研发、销售的公司。这家公司的语音识别技术ASR、声纹鉴别技术我认为是非常厉害的。

语音硬件最终解决方案方向
语音硬件最终解决方案方向

  Siri后就是一堆智能音箱的推出,笔者绝对可以叫“Siri的实体版本”。这一部分除了芯片厂商完整的解决方案外,各种独家语音技术就上来了。虽然一套完整的从芯片厂商到终端商方案,但是个人觉得目前最为重要的就在语音平台商上,因为语音平台商可以结合客户内容定制个性化需求。

亚马逊销售最好的智能硬件产品
亚马逊销售最好的智能硬件产品

  同时语音平台商有部分厂家也是直接的终端商:例如Google Assistant、Amazon Alexa、Microsoft Cortana、Apple Siri、阿里Genie、百度DuerOS等等。

国产厂商要比国际厂商更懂消费者需要什么
国产厂商要比国际厂商更懂消费者需要什么

  不过笔者说了这一些,智能音箱在实际体验中还是有非常大问题的,比如Google Assistant、Amazon Alexa、Microsoft Cortana这三个国际大厂谷歌、亚马逊在使用过程中必须要进行数据搜索,因而会连接到谷歌,结果你也可想而知。

可以看出虽然Echo虽然是老产品,但是需求量仍在不断提高
可以看出虽然Echo虽然是老产品,但是需求量仍在不断提高

  Apple Siri不评价了,估计现在很多人用来定闹钟是最常用的使用场景。

有多少人像笔者一样就用Siri添加个闹钟呢?
有多少人像笔者一样就用Siri添加个闹钟呢?

  阿里AliGenie平台系统最有代表性的就是天猫精灵X1,笔者仔细使用过一段时间,使用体验应该算比较出色的,最主要的一个特点就是用户粘度大,更新频繁。同时结合最有发展前途的幼教市场,在平常使用过程中唤醒频率也较多。

天猫精灵X1
天猫精灵X1

     而国产另外一家采用百度DuerOS系统的小度智能音箱笔者没有用过,但是基础功能应该会差不多,只不过会在自家内容独创性上有深度定制。

百度首款智能音箱
百度首款智能音箱

  总结:

HomePod推迟发货估计也让苹果自己恼火不已
HomePod推迟发货估计也让苹果自己恼火不已

  不难看出,今年智能AI风口确实和声音有关系,不管是语音识别还是自然语言学习以及智能音箱的出现,其实都可以看做未来智能家庭的一大“终端入口”(第一大终端入口为手机),而未来将像更具有分享功能的语音硬件过渡,相信这期间一定会像手机发展一样出现很多新的硬件厂商,不过作为风向标的苹果,却把HomePod推迟上市,这对于构建苹果智能家庭生态是重要的一步,虽然移动端上的HomeKit初具雏形,但是要想快速布局还需要硬件作为基底。

  最后,人工智能语音交互目前虽然更多的以智能音箱形态呈现,却也不排除其可能多场景多维度的发展。但不管怎样,语音交互带来的变革是无需质疑的,人工智能所展现出来的效率,也已经将历史的车轮向不可逆的方向推进。一大步何时迈出?未来是否可期?已经不重要了。


分享

加入收藏

网友评论 0条评论
用其他账号登录:
请稍后,数据加载中...
查看全部0条评论 >
火热围观
潮机范儿

Copyright © 2007 - 北京沃德斯玛特网络科技有限责任公司.All rights reserved 发邮件给我们
京ICP证-070681号 京ICP备09081256号 京公网安备 11010502036320号