哈希竞彩
热门标签

足球预测网(www.hgbbs.vip)_中华电信中英双语 AI 客服借助 NVIDIA GPU 加速深度学习 目标为打造可聊天的本土化语音系统

时间:1周前   阅读:9   评论:2

足球预测网www.hgbbs.vip)是国内最权威的足球赛事报道、预测平台。免费提供赛事直播,免费足球贴士,免费足球推介,免费专家贴士,免费足球推荐,最专业的足球预测网。

,

由AI对话助理提供大量资料汇整分析的知识问答服务,可将传统客服人力应用在需要更准确解决问题的情况,例如直接由AI对话助理协助回答哪些方案适合消费者当前的使用需求,而在此基础下可以直接提供精准的漫游方案选购建议,而其他人员则可聚焦在技术问题处理,或是较复杂的客诉情况。

如果曾拨打「123」致电中华电信24小时客服专线,应该都有体验过全台首创声音互动人工智慧(AI)客服,其借由拟真的语音系统提供自助式客服,或是协助转接专人客服,以解决进一步的需求。而这套系统背后采用的便是NVIDIA超大规模模型推论解决方案Triton推论伺服器,搭配旗下GPU加速深度学习系统,让中华电信能以更高的效率完成语音模型训练,进而建构高自然度的拟真语音互动体验。

更拟真的客服专线,原本需要长时间训练建立

中华电信研究院前瞻科技研究所所长汪世昌表示:「目前中华电信自行研发的中英双语语音合成技术,历年来已应用于多个领域,除了用在24小时客服专线,更应用在166、167天气预报、视障辅助等相关应用,以及中华电信旗下i宝贝智慧音箱、AI语意云、智慧广播助理等服务,同时也用于健保署、消防署的语音服务系统。」

在还没有导入AI技术时,中华电信就已着手投入拟真数位语音技术研究,从早期借由语音拼接进行合成,以及后续透过语音参数方式进行合成,到现在已经可以利用深度学习等AI技术,透过足够时间长度规模的声音资料,以及相应的文字内容,训练合成高度自然的语音模型,唯独整个训练流程仍须花费较长时间。

以目前深度神经网路(Deep Neural Network;DNN)技术推动的语音合成效果,已经可以实现逼近真人语调般的自然表现,但是借由自我回归模型(Autoregressive Model)生成诠释声音语调特征的梅尔频谱(Mel-Spectrogram),再透过人声编码器(Vocoder)合成语音内容的过程,往往需要处理大量资料数据,使得整体合成时间变得更长,因此与预期应用在实际服务上的流畅度表现将有所落差。

加上若要打造跨语言的语音系统,过去的作法是透过多种语音系统对应不同语言内容,但会导致不同语言内容以不同音色呈现,而造成使用体验不一致,因此会透过同一人录制多种语言的语音资料,借此建立相同音调的语音系统。

不过,在此需求情况下,更代表需要花费更长时间进行训练,才能顺利建立出像是中华电信此次释出的中英双语语音合成模型,并顺利应用在各类语音服务上。

而在采用NVIDIA旗下的技术资源后,中华电信将原本需要花费约7天才能完成训练的语音模型,缩短至1天即可完成,不仅让合成速度加快10倍,更让训练结果逼近真人语音,呈现更自然语调,大幅降低早期技术产生的明显机器合成语感。

▲模型训练时间缩短,合成速度加快

借助NVIDIA技术大幅缩短训练时间

汪世昌表示,将数位合成的语音系统用于客服,太重的机器合成语感会严重影响使用者的互动意愿,尤其目前越来越多服务仰赖语音互动,自然的语感表现更容易吸引使用者互动。

不过,要打造自然语感的合成语音表现,自然需要庞大的资料量进行深度训练,以过往训练模式须花费更长时间完成,但是借由导入NVIDIA超大规模模型推论解决方案Triton推论伺服器,并搭配TensorRT深度学习推论平台,以及透过GPU加速的cuDNN 函式库等资源,同时,借由NVIDIA Elite合作伙伴丰康科技协助导入NVIDIA的硬体设备,包括NVIDIA DGX-1超级电脑、RTX A6000 GPU与多张NVIDIA T4 Tensor 核心 GPU等进行运算,即可让原本需要花费多时才能完成的模型训练,缩短至1天即可完成,更可在整个训练过程中降低成本支出。

▲NVIDIA Triton推论伺服器架构 ▲语音合成Triton推论工作流程

如此一来,即便语音模型需要重新训练,或是加入不同参数等,都能在更短的时间内完成,借此让合成语音系统能更符合实际应用需求、同时也更自然,甚至反应速度更快。

拟真语调只是初期应用,未来计画创造可聊天互动的AI对话系统

不仅侷限在中、英两种语言,汪世昌进一步说明目前还有台语与客语,未来也会因应市场需求加入更多语言,以及语意理解与上下文衔接,让数位语音系统可以结合AI对话助理,借此实现更广泛的代理服务应用模式,例如从当前的电话客服系统,进一步衍生能够依照致电者需求自然应答的语音互动模式,让餐厅等商家可以在无须增加人手的情况下,即可透过语音系统接下更多订单或处理更多订位需求。

▲机器人客服情境

汪世昌认为,由AI对话助理提供大量资料汇整分析的知识问答服务,可将传统客服人力应用在需要更准确解决问题的情况,例如直接由AI对话助理协助回答哪些方案适合消费者当前的使用需求,而在此基础下可以直接提供精准的漫游方案选购建议,而其他人员则可聚焦在技术问题处理,或是较复杂的客诉情况。

为了建立更有智慧的AI对话助理,需要更庞大的资料与知识问答进行训练,并且透过更强的算力缩短整体训练时间,因此未来中华电信也会持续与NVIDIA合作,并藉其解决方案创造更符合自然语调、精准正确的语音互动体验。

免费开放中英双语语音合成模型及语料库,希望推动更多台湾在地化智慧语音发展

而此次对外免费开放的中英双语语料库,计画于Q3前发布在NVIDIA DeepLearningExample 开源平台,主要是由一名女性专业录音员录制总长达4.5小时、总计2740段中英双语内容,内容更以科技产品相关语句为主,成为亚洲地区第一个免费开放使用的中英双语语料库,借此让更多业者能够打造符合台湾人使用的语音系统,同时推动更多以语音为互动的AI应用发展。

汪世昌进一步表示,主要考量目前市面上适合中英双语使用的语言模型资料稀少,同时取得成本较高、取得管道也相对复杂,因此希望透过此次释出的开放中英双语语音合成模型及语料库,催化台湾产学研界打造更好的语音合成应用,未来也期待能透过更多「广结盟」合作,强化本土技术应用发展。

上一篇:足彩预测(www.99cx.vip):欧洲贵族运动杀入中国 李桂兰 吴夏萍热捧雪地马球大呼刺激

下一篇:新2最新网址(www.hg108.vip)_中国三人篮球国家队开启队史最长海外赛练之行

网友评论

  • 2022-08-21 00:09:49

    近日,国务院印发《扎实稳住经济的一揽子政策措施》,推出六个方面33项措施。其中,在财政政策方面,进一步加大增值税留抵退税政策力度,预计新增留抵退税1420亿元;在货币金融政策方面,鼓励对中小微企业和个体工商户、货车司机贷款及受疫情影响的个人住房与消费贷款等实施延期还本付息,加大普惠小微贷款支持力度。小伙伴看呆了

  • 2022-09-20 00:38:49

    Topping the actives list, Top Glove dove seven sen to 78.5 sen on the back of 117.93 million shares exchanging hands. Kossan Rubber Industries fell eight sen to 99 sen and Hartalega dropped 12 sen to RM1.88, also on heavy trading volume.欢迎各位新粉