趣丸集团与港中大(深圳)联合开源语音大模型MaskGCT
近期,趣丸科技集团宣布与香港中文大学(深圳)联合研发的语音大模型“MaskGCT”正式在Amphion系统中开源,面向全球用户开放使用。区别于传统TTS模型,该模型采用掩码生成模型与语音表征解耦编码的创新范式,在声音克隆、跨语种合成、语音控制等任务中展现出卓越效果。
MaskGCT在三个TTS基准数据集上都达到了SOTA效果。
MaskGCT模型是在包含10万小时多语言数据的Emilia数据集上进行训练的,展现出了超自然的语音克隆、风格迁移以及跨语言生成能力,同时保持了较强的稳定性。这一模型的推出,不仅为语音合成领域带来了新的技术突破,也为趣丸集团在智能语音技术方面的布局注入了新的活力。
作为此次合作的另一方,香港中文大学(深圳)在语音合成与表征领域有着深厚的研究基础。此次与趣丸集团的合作,不仅充分发挥了双方在技术研发和资源整合方面的优势,也进一步推动了语音合成技术的创新与发展。
值得一提的是,MaskGCT模型已经在香港中文大学(深圳)与上海人工智能实验室联合开发的开源系统Amphion上发布,并提供了模型下载和Demo展示等功能。这一举措不仅有助于推动语音合成技术的普及和应用,也为广大开发者提供了一个学习和交流的平台。
趣丸集团作为一家在智能语音技术方面有着深厚积累的企业,此次与港中大(深圳)的合作无疑为其在语音合成领域的发展注入了新的动力。未来,趣丸集团将继续加大在智能语音技术方面的研发投入,推动更多创新技术的应用和落地,为用户提供更加智能、便捷的服务体验。
目前,MaskGCT在短剧出海、数字人、智能助手、有声读物、辅助教育等领域拥有丰富的应用场景。为了加快落地应用,在安全合规下,趣丸科技打造了多语种速译智能视听平台“趣丸千音”。一键上传视频即可快速翻译成多语种版本,并实现字幕修复与翻译、语音翻译、唇音同步等功能。该产品进一步革新视频翻译制作流程,大幅降低过往昂贵的人工翻译成本和冗长的制作周期,成为影视、游戏、短剧等内容出海的理想选择平台。
声明: 本文内容转载自:中国青年网,原标题《趣丸集团与港中大(深圳)联合开源语音大模型MaskGCT》,版权归原作者所有,内容为原作者独立观点,不代表本站立场。所涉内容不构成投资消费建议,仅供读者参考。您如因版权和若对该稿件内容有任何疑问,请与邮箱:KCMEDIA@ALIYUN.COM联系,本网将迅速给您回应并做处理。
-
新质生产力视角下 汤臣倍健如何重塑行业格局
新质生产力视角下 汤臣倍健如何重塑行业格局 [详细] -
复兴区奇迅创业孵化基地:点燃创业梦想,助力经济腾飞
在河北省邯郸市复兴区,一座充满生机与活力的创业孵化基地——奇迅创业孵化基地,正以其独特的魅力和强大的孵化能力,成为众多创业者的梦想启航地。该基地位于复兴区建设大街8 [详细] -
多力入选《世界品牌年鉴2024》,用品质与创新诠释健康理念
12月3日,2024企业家博鳌论坛·《世界品牌年鉴2024》发布礼成功举办,此次活动以“品牌力量,共创未来”为主题,由中华人民共和国年鉴社、新华出版社、凯度集团联合主办。本次发布礼不仅是对过去一年全 [详细]
微信
微博
百家号