国际第一!小米声音识别算法模型在业界率先突破50mAP【附语音识别行业市场分析】

温杨洋

1

图源:摄图网

9月13日,小米公司重磅宣布,小米自研声音识别算法在音频标记(Audio Tagging)任务中取得重要进展。

据介绍,以公开数据集 AudioSet-2M 的音频数据作为训练集的音频标记模型,首次突破 50 mAP 的分数,此项突破标志着小米声音识别算法已在国际上性能排名第一

小米公司表示:“未来我们将不断探索科技新高度,在手机、音箱、手环、CyberDog 等丰富的设备使用场景中,给用户带来更高效更准确的声音识别体验。”

语音识别是人机交互的入口,是指机器/程序接收、解释声音,或理解和执行口头命令的能力。随着语音技术与智能手机、平板电脑等电子产品芯片集成的深入发展,用户交互体验水平将得到大幅提升,用户认知和习惯得以培养,全球语音识别市场规模将会继续保持稳步扩张态势。

随着技术端的快速发展,语音识别市场得到的快速发展。语音识别准确率得到了极大的提升。

图表3:2012-2019年语音识别头部厂商准确率(单位:%)

2019年中国语音识别行业市场规模为95.6亿元,语音识别市场规模保持高速增长,2020-2024年复合增长率预计为19.2%。2020年中国语音识别行业市场规模将突破百亿元。

图表2:2016-2020年中国语音识别市场规模(单位:亿元)

随着语音技术和自然语言理解技术的快速进步,AI语音语义技术已在智能翻译、智能医疗、智能汽车、智能客服、互联网语音审核等多个领域实现场景应用。

前瞻产业研究院预计到2024年全球智能语音市场规模将达到215亿美元,其中智慧医疗健康、智慧金融以及各类智能终端智能语音技术需求将成为主要的驱动因素。

图表5:2018-2024年全球语音识别市场规模(单位:亿美元)

AI领域专家吴恩达认为语音识别技术的发展将推动人机交互方式的变革,使得人们可以通过语音与智能设备进行更自然、便捷的交流。

摩根士丹利在研报中预计全球语音识别市场规模将继续增长,并且随着人工智能技术的不断发展,语音识别将在各个行业中得到广泛应用。

前瞻经济学人APP资讯组

更多本行业研究分析详见前瞻产业研究院《中国人工智能行业发展前景预测与投资战略规划分析报告

同时前瞻产业研究院还提供产业大数据产业研究报告产业规划园区规划产业招商产业图谱智慧招商系统行业地位证明IPO咨询/募投可研IPO工作底稿咨询等解决方案。在招股说明书、公司年度报告等任何公开信息披露中引用本篇文章内容,需要获取前瞻产业研究院的正规授权。

更多深度行业分析尽在【前瞻经济学人APP】,还可以与500+经济学家/资深行业研究员交流互动。

可行性研究报告

广告、内容合作请点这里:寻求合作

咨询·服务

相关阅读