互联网 > 正文
人工智能网热度:

输入法语音识别率谁家最准确?

科技改变生活,“懒”是生产力提高的动力。就像人们懒得走路,就发明了汽车飞机;出门懒得拿钱包就出现了网络支付一样,当人们懒得使用键盘输入文字时,输入法语音识别就出现了。早在计算机发明之前,自动语音识别的设想就已经被提上了议事日程,早期的声码器可被视作语音识别及合成的雏形。1920年代生产的"Radio Rex"玩具狗是最早的语音识别器,当这只狗的名字被呼唤的时候,它能够从底座上弹出来。最早的基于电子计算机的语音识别系统是由AT&T贝尔实验室开发的Audrey语音识别系统,它能够识别10个英文数字。其识别方法是跟踪语音中的共振峰。该系统得到了98%的正确率。到1950年代末,伦敦学院(Colledge of London)的Denes已经将语法概率加入语音识别中。

笔者接触的第一款语言识别软件是1997年的IBM ViaVoice语言识别系统,可以安装在Windows95及以上版本,支持中文、法语、德语、意大利语、日语、西班牙语、英国英语及美国英语。通过大约20句左右的发音学习,让系统习惯你的语言表述方式,既可以当作输入法使用,也可以控制PC做大部分操作,当时的笔者的普通话还不错,识别率达到95%以上。

随着手机类移动终端的推广,移动端的语音识别就出现了。最早的应该就是Siri了吧。Siri 公司创建于2007年。起初 Siri 只是 iOS 平台中的一个应用程序,并同时在黑莓与 Android 平台提供Siri软件,但在苹果公司于 2010 年 4 月 28 日收购了 Siri 公司并重新开发后,Siri 成为了苹果设备的内置软件,并只允许在 iOS、macOS 中运行。

此后一段时间,谷歌的speech-api、微软的MicrosoftSpeech SDK、科大讯飞的iFLY Mobile Speech Platform一一出现,语音识别被绝大多数移动端所应用。

如今大家熟悉的移动端带语音识别的输入法基本就是搜狗输入法、讯飞输入法、百度输入法这3种了。3种输入法的语音识别率都在98%以上,都是基于大数据归纳总结优化的产品,单就笔者的感觉而言,3种输入法可谓不分伯仲。

如果非要分出个第一第二,笔者也只能从2019年初语音输入法的市场调研结果来看了。普通话方面三者基本相同,在方言识别方便讯飞遥遥领先,识别速度也是讯飞快一些。搜狗是基于互联网词库的智能组词与调频算法,因此在没有网络的情况下速度略慢。具体的使用效果还是根据每个人自己的习惯来定的,你觉得哪家的语音识别率最高呢。

欢迎关注微信公众号:dcwlcm666;合作及投稿请联系:1519329887@qq.com

赞助商