人工智能一大风口:和声音有关的那些事
看过《攻壳机动队》电影的小伙伴应该不陌生里边的素子,语音识别控制各种协议签订可以说是最酷的行为。语音识别可以说是目前我们可以感受到最近的技术。从Siri到今天日益盛行的智能音箱,从上游技术到下游产品,“智能”这个词一直在反复强调。
其实Siri那一套就是自然语识别:ASR(automatic speech recognition,自动语音识别)+NLP(nature language processing,自然语言处理)+TTS(Text To Speech)。语音识别和自然语言理解都是Siri中必不可少的部分。
语音识别实现的是从语音到文字的转换。语音对于电脑来说,就是对声音每秒n次采样后的一组二进制流,电脑无法理解其含义。只有将语音识别成文字,电脑才能进行后续的处理。
自然语言理解实现是文字的理解。比如电脑收到文本“今天天气怎样”,理解后会返回“今天下午下雨”类似的结果。 通常最简单的做法是收集大批的人工问答集合。比如抓取知乎、百度知道等人工回答的问答集,并进行处理。对于用户输入的问题,则会在这些问答集里的问题里进行搜索匹配,找到相关度最高的,将问题的答案返回给用户。
版权所有,未经许可不得转载
加入收藏