写点什么

08. 语音识别与第二次 AI 热潮

发布于: 2 小时前
08. 语音识别与第二次AI热潮

写在前面:

大家好,我是强哥,一个热爱分享的技术狂。目前已有 12 年大数据与 AI 相关项目经验, 10 年推荐系统研究及实践经验。平时喜欢读书、暴走和写作。

业余时间专注于输出大数据、AI 等相关文章,目前已经输出了 40 万字的推荐系统系列精品文章,强哥的畅销书「构建企业级推荐系统:算法、工程实现与案例分析」已经出版,需要提升可以私信我呀。如果这些文章能够帮助你快速入门,实现职场升职加薪,我将不胜欢喜。

想要获得更多免费学习资料或内推信息,一定要看到文章最后喔。

内推信息

如果你正在看相关的招聘信息,请加我微信:liuq4360,我这里有很多内推资源等着你,欢迎投递简历。

免费学习资料

如果你想获得更多免费的学习资料,请关注同名公众号【数据与智能】,输入“资料”即可!

学习交流群

如果你想找到组织,和大家一起学习成长,交流经验,也可以加入我们的学习成长群。群里有老司机带你飞,另有小哥哥、小姐姐等你来勾搭!加小姐姐微信:epsila,她会带你入群。


语音识别与第二次 AI 热潮

上次我们讲到了图灵测试与第一次人工智能浪潮,这次带大家了解一下语音识别与第二次人工智能浪潮的故事。

 

20 世纪 80 年代到 90 年代的第二次 AI 浪潮中,语音识别是当时最具有代表性的几项突破性进展之一,让计算机听懂人们说的每一句话,每一个字词,这是人工智能这门学科诞生第一天科学家就努力追求的目标。但虽然语音识别算法在那个时代处于领先地位,但距离人们觉得系统可用的心理阈值还有一定距离。直到那个时代的学者们摒弃了传统符号主义方法,语音识才真正取得实质性进展。

 

科技瞬息万变,每个时代都有每个时代的领军人物和代表性的技术方向。从 20 世纪 70 年代末到 20 世纪 90 年代中,比尔盖茨和史蒂夫乔布斯所代表的的创业者们,缔造出微软,苹果等科技神话,从 20 世纪 90 年代末到 2015 年前后,谷歌、腾讯、阿里、百度等科技巨头以及后生可畏的小米,美团等新兴独角兽公司,先后在互联网领域和移动互联网领域引领科技大潮。

 

今天的主角是人工智能,移动互联网的浪潮尚未平息,人工智能的创投就已经进入了令人兴奋的上升期。而今天的人工智能智能热潮离不开此前数十年中几代研究者的耕耘与铺垫,李开复博士与同时代的学者在第二次 AI 热潮中对传统符号主义方法的摒弃,选择使用统计模型破解语音识别难题,将识别准确率提升了一个层次,这与今天的研究者们在统计模型基础上引入深度学习方法,真正将语音识别提升到实用化的高度是一脉相承的,这数十年里,语音识别在技术选型上的波折与起伏,也正是人工智能技术螺旋形上升、发展的一个缩影。

 

在人工智能的上一个时代,符号主义专家,特别是语言学家们还风光无限,但实践结果表明,统计学派才可以真正提高语音识别与自然语言处理的准确率,而今天,语音识别和更广泛意义上的自然语言处理已经走上了统计方法与深度学习方法相结合,甚至是深度学习方法独立起主导作用的时代,与上一个时代相比,今天的语音识别才真正满足了用户的应用需求。

 

深度学习就像一个秘密武器,蛰伏多年,重出江湖,首先在计算机视觉领域帮助计算机认识人脸,认识图片和视频中的物体,然后冲入语音识别,机器翻译,数据挖掘,自动驾驶等几乎所有人工智能的技术领域大展身手。

 

2013 年前的一二十年中,主流的语音识别算法在各主要语音测试数据集中的识别准确率还与人类的听写准确率有一定差距。这个期间将按照单词统计的识别错误率从 40%左右降低到了 20%左右,也就是说,深度学习技术在语音识别系统广泛应用之前,基本还停留在比较稚嫩的阶段,但今天的深度学习时代,只用了两三年的时间,微软,IBM、谷歌等公司就将语音识别的错误率从 20%降到了 6.3%。

 

这就是为什么我们说,如今这一波人工智能浪潮的最大特点是人工智能技术真正突破了人类的心理阈值,达到了大多人心中的可用标准。例如,今天我们拿出手机,使用手机内置的语音输入法,或者使用中文世界流行的科大讯飞语音输入法,我们就可以直接对着手机说话以录入文字信息。在一些不方便操作键盘的场合,我们就可以使用语音输入法输入文字,非常方便。

发布于: 2 小时前阅读数: 5
用户头像

还未添加个人签名 2018.05.14 加入

公众号【数据与智能】主理人,个人微信:liuq4360 12 年大数据与 AI相关项目经验, 10 年推荐系统研究及实践经验,目前已经输出了40万字的推荐系统系列精品文章,并有新书即将出版。

评论

发布
暂无评论
08. 语音识别与第二次AI热潮