你的位置:安美特光电子 > 科技 > 本色出海“利器”:趣丸科技与港中大(深圳)发布首款开源模子
科技
本色出海“利器”:趣丸科技与港中大(深圳)发布首款开源模子
发布日期:2024-10-27 07:25    点击次数:173

10月24日,趣丸科技晓示与香港汉文大学(深圳)运筹帷幄研发的语音大模子“MaskGCT”崇敬在Amphion系统中开源,面向巨匠用户通达使用。分手于传统TTS模子,该模子采纳掩码生成模子与语音表征解耦编码的革命范式,在声息克隆、跨语种合成、语音戒指等任务中展现出不凡效用。

府上披露,MaskGCT(Masked Generative Codec Transformer)是一个大范围的零样本TTS模子,采纳非自转头掩码生成Transformer,无需文本与语音的对王人监督和音素级捏续时候瞻望。其工夫破损性在于采纳掩码生成模子与语音表征解耦编码的革命范式。实践标明,MaskGCT在语音质料、相通度和可意会性方面优于现时起先进的TTS模子,而况在模子范围和检察数据量加多时发达更佳,同期大要戒指生谚语音的总时长。MaskGCT已在香港汉文大学(深圳)与上海东谈主工智能实践室运筹帷幄开发的开源系统Amphion发布。

趣丸科技方面暗示,相较于现存的TTS大模子,MaskGCT在语音的相通度、质料和踏实性上进一步破损,尤其在语音相通度方面处于率先水平。据先容,MaskGCT在三个TTS基准数据集上都达到了SOTA效用,向上现时起先进的同类模子。

当今,MaskGCT在短剧出海、数字东谈主、智能助手、有声读物、援手考验等鸿沟领有丰富的行使场景。为了加速落地行使,在安全合规下,趣丸科技打造了多语种速译智能视听平台“趣丸千音”。一键上传视频即可快速翻译成多语种版块,并竣事字幕引诱与翻译、语音翻译、唇音同步等功能。该产物进一步改换视频翻译制作进程,大幅缩短过往崇高的东谈主工翻译资本和冗长的制作周期,成为影视、游戏、短剧等本色出海的理念念平台。

南边+记者 叶丹



Powered by 安美特光电子 @2013-2022 RSS地图 HTML地图

Copyright Powered by站群 © 2013-2024

辽ICP备4715626号