行业要闻 > 正文
《中国智能语音产业发展报告(2021-2022)》
新需求爆发,智能语音市场迎来黄金期
2023/1/13 09:55   人民邮电报      关键字:智能语音 发展报告 市场迎来 黄金期      浏览量:
1月11日,由国家工业信息安全发展研究中心主办,科大讯飞股份有限公司、国家语音及图像识别产品质量检验检测中心、国家智能语音创新中心协办的中国智能语音产业发展高峰论坛暨2022年中国语音产业联盟年会成功举办。
  1月11日,由国家工业信息安全发展研究中心主办,科大讯飞股份有限公司、国家语音及图像识别产品质量检验检测中心、国家智能语音创新中心协办的中国智能语音产业发展高峰论坛暨2022年中国语音产业联盟年会成功举办。
  会上,中国语音产业联盟发布《中国智能语音产业发展报告(2021—2022)》,报告指出,我国智能语音产业整体发展环境积极向好,多项关键技术取得突破,产业扎根不断深入,已形成大中小企业融通创新、协同发展的健康生态。
  市场规模高速增长龙头企业占据主导份额
  智能语音作为智能时代人机交互的关键接口,各行业爆发式的场景需求驱动行业发展进入黄金期,技术突破和应用落地不断深入。从全球范围来看,2022年全球智能语音产业规模将达351.2亿美元,保持33.1%的高速增长;从我国来看,根据德勤统计数据,2022年我国智能语音市场规模将达341亿元,同比增长13.4%。
  报告指出,以科大讯飞为代表的语音龙头企业布局较广,是行业创新发展的支柱,占据较大市场份额。同时,科大讯飞、百度、阿里等龙头企业通过打造技术能力开放平台,构建开源生态,引领行业技术创新和应用开发。以讯飞开放平台为例,目前已开放545项AI产品及能力,聚集超过380.5万开发者团队,开发出超过159.5万个AI应用,并从AI龙头﹢开发者的“二维”生态,升级到AI龙头﹢行业龙头﹢开发者的“三维”生态,联合行业龙头搭建基线系统,让更多开发者加入数字经济浪潮。
  关键技术突破筑牢行业坚实底座
  “2022年是智能语音技术突破的关键年”,报告指出,我国智能语音企业在多项难点技术上实现新的突破。纵向上从语音识别、合成、翻译向计算机视觉、认知智能、运动智能领域延伸,横向上从单点技术突破模式发展到机器认知、多模式复杂场景应用。
  在语音识别方面,视听融合的多模态交互技术成为技术演进的主要方向。科大讯飞多模语音增强技术融合语音与视觉的多模感知,让高噪音场景下的语音交互跨过实用门槛,率先在车载、会议、地铁购票和医疗挂号等场景落地。此外,针对低资源语音识别难题,海天瑞声和科大讯飞分别从语音数据和算法层面推动技术进步。
  在语音合成方面,随着电商直播等行业的繁荣,语音合成技术也表现出拟人化、口语化的发展趋势。科大讯飞多风格多情感语音合成系统SMART-TTS可提供11种强度可调的情感合成能力。而火山语音的超自然对话语音合成和Meta的语音对语音翻译(speech- to- speech translation,S2ST),通过在模型训练中添加副语言数据,让语音交互更加自然和个性化。
  要促进智能语音技术持续突破,与会专家从两个方向提出了发展路径。一方面,中国科学院院士姚建铨指出,针对智能语音多学科交叉的学科特性,研究人员需要探索新原理、新机制、新材料、新工艺和新器件,集成创新推动核心技术进步;另一方面,语音技术需要进一步向深度理解延伸,科大讯飞总裁吴晓如表示,“更先进的语音交互系统不仅要‘能听会说’,还要深度去理解人的信息”,自然语言理解和知识推理技术的进步,让机器可以在越来越多的领域帮助人类解决更专业和复杂的问题。
  应用规模化落地加速与实体经济融合
  报告指出,受疫情和产业数字化、智能化转型影响,智能语音应用场景迅速铺开。据德勤统计数据,预计到2030年,智能语音消费级和企业级应用市场可分别超过700亿和千亿规模。
  在消费者产品领域,AI学习机、翻译笔等AI﹢学习产品帮助学生学习减负增效;智能录音笔、智能办公本、智能鼠标等AI﹢办公产品深受职场人士欢迎;AI翻译机、智能麦克风、智能语音键盘、智能耳机、智能助听器等AI﹢生活产品,让更多人享受AI科技的便利。
  在汽车领域,智能语音已成为人机交互关键环节,并从车内交互衍生到车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。以科大讯飞为代表的国内AI龙头已占据中国语音交互车端应用行业的领先地位。
  在运营商领域,智能语音技术与健康养老、家庭教育、家庭娱乐等场景结合,带来更加智慧的家庭生活体验。融合5G与机器翻译技术的无障碍智能通信,让普通的5G手机用户不用下载任何软件就可以使用实时翻译和转写服务,实现跨语种的无障碍视频通话。
  在教育领域,科大讯飞全球中文学习平台已覆盖全球183个国家,吸引300多万海外中文学习爱好者使用;利用智能语音和人工智能技术可实现英语听说教、学、考、评、管一站式服务,减少无效训练。
  在医疗领域,去年疫情期间,科大讯飞电话机器人助力全国31个省(区、市)的112个地市疫情排查,累计服务超1.1亿人次;智能外呼和智医助理可用于独居老人、留守儿童的日常关爱和兜底保障。
  在城市领域,智能语音技术已在安徽省一体化网上政务服务平台、山东聊城城市大脑、海南三亚市崖州湾科技城智慧产城园区、天津市AI银发智能服务平台等创新示范项目中应用。姚建铨院士指出,智能语音与建设智慧城市的要求完全吻合,可以实现各种语音高效转换和智能处理,为智慧城市进一步建设带来新的机遇。
  在工业领域,我国打造了包括国家智能语音创新中心在内的一批语音技术创新“国家队”,开展工业声学、多语种、AI语音芯片等关键共性技术研究工作。科大讯飞联合国家智能语音创新中心打造的工业听诊器、声学成像仪、工业设备卫士、智能巡检机器人等“工业六感”产品,已广泛应用到生产、质检、巡检等多个工业环节。
  在金融领域,声纹识别技术已经被应用在各类身份认证环节。得意音通董事长郑方表示,声纹是目前除DNA外最可靠的身份认证方式,相比传统方法具有明显优势。此外,科大讯飞智能客服机器人、智能联络中心AICC等AI﹢金融应用,帮助金融机构提升客服和运营效率。
  展望智能语音产业未来发展,报告认为,后竞争时代亟须关注新增的不确定性因素,包括核心关键技术能力仍需提升,开源生态培育仍需加大投入,重点应用场景落地仍需提速,传统行业开放场景动能不足等。

微信扫描二维码,关注公众号。