当前位置： CNMO > 新闻 > 新闻 > 消息 > 正文

翻易通的语言数据让AI翻译变得更加准确

CNMO 【编译】作者：任泽宇 2018-11-12 15:10

评论（0）

 

　　【手机中国新闻】正值科技公司们正试图为消费者提供更先进的服务之时，由人工智能驱动的翻译系统已经成为他们最主要的兴趣之一。这一市场趋势为韩国初创公司翻易通提供了可以增加销售额和发展客户的重要机遇，该公司自2012年作为翻译众包平台成立以来通过精准的人类翻译收集了大量语言数据。CEO Simon Lee对媒体透露他的公司已经在向一些公司出售语言数据用于训练它们的机器翻译系统。

　　公司销售额2015年的4亿韩元一路跃升至今年前8个月的50亿韩元，Lee预测今年的销售总额能达到70亿韩元。其中绝大部分收入来自于销售被称作语料库的语言数据。Lee同时也表示，机器需要学习很多来提升它们的表现，而缺少累积的数据会使机器产出的结果不够理想。他说:“机器自己产出语言数据是不可能的，语言，语法和发音的范畴太广了。”

翻易通

　　他同时也解释道目前有两种收集语言数据的方法，一种是通过人类专家的翻译结果来收集，另一种是借助随机人群的集体智慧。前者能够提供更准确的结果但时间和经济成本太高，后者则相反。

　　翻易通通过第二种方法向网民收集数据，并努力解决其不足，包括要求人们进行更仔细的检查。其质量控制系统的工作令人满意。这最终使该公司能够以其它公司十分之一的价格出售高质量的语言数据。

　　迅速发展的人工智能技术和日益增长的数据需求挽救了一度陷入困境的公司。其客户包括为东京奥运研发翻译系统的日本公司NTT DoCoMo，以及百度，腾讯，微软和Expedia。它提供的包含24种语言的服务也吸引了来自173个国家的950万个人用户，这其中很大一部分是YouTube视频创作者，他们借助翻易通的翻译服务为视频提供字幕来获取海外的观众。

翻易通

　　Lee表示公司已经注意到来自YouTube的需求并将其作为增加收入来源多样性的渠道。翻易通通过其质量控制系统能够提供接近于百分之百准确的视频翻译服务。他同时也承认机器不能打败人类翻译。公司依然以来人类翻译获取语言数据，人工智能驱动的机器翻译还不完美。其目标是用前者收集的数据来训练后者，进而使双方共同成长。

　　Lee计划今年增加阿拉伯语，越南语和印地语的服务。为了紧跟潮流，这家初创公司也在收集语音数据来满足迅速攀升的AI语音识别服务需求。除了现有的韩国总部和中国，日本分部，它还计划在美国和中东设立新分支。

 