文/标贝(北京)科技有限公司
长久以来,传统的语音合成技术,主要围绕着统计参数合成和拼接合成展开,两种方法虽各有利弊,但基本满足了可懂度的要求,语音合成技术得以在多种场景下应用,尤其是导航播报这样的强需求场景。
最近几年,基于深度学习的语音合成技术快速发展,语音合成系统中的模型逐步被深度学习模型所替代。
尤其是年,随着wavenet技术的问世,将参数合成技术带入了一个新的阶段。神经网络声码器的合成效果,逐步接近拼接合成的音质,而其流畅度明显好于拼接合成。从wavenet,parallelwavenet,到waveglow,wavernn等,神经网络声码器技术持续进步,算法复杂度不断下降,逐渐让工程化应用成为可能。
标贝科技,一直密切