搜索优化
English
搜索
Copilot
图片
视频
地图
资讯
购物
更多
航班
旅游
酒店
房地产
笔记本
Top stories
Sports
U.S.
Local
World
Science
Technology
Entertainment
Business
More
Politics
时间不限
过去 1 小时
过去 24 小时
过去 7 天
过去 30 天
按相关度排序
按时间排序
腾讯网
9 天
3秒实现多音色混合克隆!F5/E2 TTS教程上线;PsyDTCorpus 5k 心理对话数据 ...
在声音克隆快速发展的浪潮中,AI 已经能够模拟出越来越逼真的人声效果,但对零样本学习和多情感控制方面依然挑战重重。今年年初,E2 TTS 就实现了简化文本到语音的生成方法,只需用填充标记将文本输入填充到与输入语音相同的长度,再进行去噪处理即可生成语音 ...
11 天
超快速文本转语音模型Lightning:超低延迟, 100毫秒生成10秒音频
近日,总部位于美国加州旧金山的 AI 初创公司 smallest.ai 推出了其新产品 ...
新浪网
23 天
趣丸科技联合港中大(深圳)开源首个语音大模型,效果全球领先 ...
10月24日,趣丸科技宣布与香港中文大学(深圳)联合研发的语音大模型“MaskGCT”正式开源,面向全球用户开放使用。区别于传统TTS模型,该模型 ...
腾讯网
29 天
F5-TTS-MLX语音模型,苹果MacOs本地安装包
F5-TTS-MLX语音模型,苹果MacOsAppleSilicon本地安装包,文字转语音,TTS,基于苹果MLX框架F5-TTS-MLX语音模型苹果安装包:https://pan.quark.cn/s ...
CTI论坛
14 年
语音合成技术的原理
当 前, 语 音 合 成 的 研 究 已 经 进 入 文 字 - 语 音 转 换(TTS) 阶 段, 其 功 能 模 块 可 分 为 文 本 分 析、 韵 律 建 模 和 语 音 合 成 三 ...
10 天
on MSN
语音大模型「MaskGCT」正式开源,为短剧、游戏、数字人等产品提供服务
10月24日,趣丸科技宣布与香港中文大学(深圳)联合研发的语音大模型「MaskGCT」正式在Amphion系统中开源,面向全球用户开放使用。区别于传统TTS模型,MaskGCT采用掩码生成模型与语音表征解耦编码技术,在声音克隆、跨语种合成、语音控制等任务环节中能够快速落地。 测试结果(来源:MaskGCT) 据了解,相较于现有的TTS大模型,MaskGCT在语音的相似度、质量和稳定性上进一步突破, ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果
反馈