电信TeleAI升级,星辰语音模型更智能
近日,中国电信人工智能研究院(TeleAI)再次刷新行业纪录,其自主研发的星辰超多方言语音识别大模型在短短半年内实现了重大突破。该模型在原有支持30种方言的基础上,新增湛江话、宜宾话、洛阳话、烟台话等方言识别能力,使得方言种类覆盖范围达到40种,同时引入了英文识别功能。
TeleAI通过创新性的“预训练+微调”技术,对星辰语音大模型进行了升级。这种方法利用海量无标注数据进行预训练,并通过少量有标注数据进行微调,有效地应对了方言语音数据标注资源稀缺的挑战。这一方案与方言场景的需求高度契合,大大提高了模型的适应性。
值得关注的是,TeleAI在模型结构和成本优化方面也取得了显著成果。该方案能够将人工标注数据的需求量降低约50倍,同时保证模型效果与有监督训练的方言模型相当,为行业树立了新的标杆。
为方便行业同仁学习和交流,TeleAI将相关开源代码发布至GitHub,供大家查阅和使用。开源地址如下:https://github.com/Tele-AI/TeleSpeech-ASR
这一成果的发布,不仅展现了中国电信在人工智能领域的深厚实力,也为方言语音识别技术的进一步发展提供了新的可能性。未来,TeleAI将继续深耕技术,为用户提供更加智能、便捷的服务。