git clone https://github.com/FunAudioLLM/CosyVoice
。克隆完之后,得安装依赖项,用pip install -r requirements.txt
就能搞定。https://www.modelscope.cn/studios/iic/CosyVoice-300M
。下载好的模型要放在项目目录下的pretrained_models
文件夹里。要是你想体验更多功能,还可以下载CosyVoice-300M-SFT
和CosyVoice-300M-Instruct
这两个模型,它们分别适合预训练音色生成和情感控制。pyloudnorm
库来标准化音量,避免合成后的音频忽大忽小。具体操作是,先导入库,再加载音频文件,然后用meter.integrated_loudness
计算响度,最后用pyln.normalize.loudness
进行归一化。代码大概是这样的:import pyloudnorm as pyln
import torchaudio
def normalize_audio(audio, rate):
meter = pyln.Meter(rate)
loudness = meter.integrated_loudness(audio)
return pyln.normalize.loudness(audio, loudness, -16.0)
audio, rate = torchaudio.load('input.wav')
normalized_audio = normalize_audio(audio, rate)
torchaudio.save('normalized.wav', normalized_audio, rate)
CosyVoice-300M
;要是你想用内置的预训练音色快速生成语音,CosyVoice-300M-SFT
更合适;要是你想通过自然语言控制情感和韵律,那就得用CosyVoice-300M-Instruct
。python webui.py --model_dir pretrained_models/CosyVoice-300M
。启动之后,浏览器会自动打开 WebUI 界面,你可以在里面进行各种操作。<|en|>
表示英文,<|jp|>
表示日文。例如,你想生成英文语音,就输入<|en|>Hello, how are you?
,然后上传中文参考音频,点击生成就能得到带有中文音色的英文语音。CosyVoice-300M-Instruct
模型,就可以通过自然语言或富文本标签来控制语音的情感和韵律。比如,你在文本中加入强调
标签,合成的语音就会在 “强调” 这个词上加重语气;加入(laughter)
标签,就会在指定位置插入笑声。pyloudnorm
库对音频进行归一化处理,具体方法前面已经介绍过。temperature
值可以让生成的语音更有随机性,减少则会更稳定。🔍 个人公众号如何找准定位?2025 年,小而美的领域更有机会 现在做公众号,再像以前那样追热点、写泛内容,可能很难出头了。2025 年的微信公众号平台,算法推荐机制越来越成熟,新号也有机会获得流量
现在市面上的 AI 写作软件种类繁多,让人眼花缭乱。这些工具在润色功能上各有千秋,到底哪款能让你的文章更出彩呢?今天就来详细评测几款主流的 AI 写作软件润色功能。 先说说 Grammarly,这是一
🛠️ 2025 论文降重免费软件深度评测:工具实测 + 降重技巧全解析 写论文的时候,重复率就像个甩不掉的小尾巴,让人头疼不已。要是能有一款免费又好用的降重软件,那可真是帮了大忙。不过现在市面上的软
现在各平台对原创作品要求极高,简单的 AI 写作已经难以通过原创检测,所以写作方法得全面升级,既要让文章有吸引力、有流量属性,又得能通过朱雀大模型平台的 AI 味检测。这里有个关键,就是得减少感叹号或
?双机位布置:打造360°无死角面试环境力扣模拟面试的双机位要求让不少同学犯难,其实把它想象成给电脑装个「监控搭档」就简单了。主机位就是咱们平时用的电脑摄像头,记得调整到能露出整张脸和桌面的角度——下巴别藏在阴影里,键盘也别只露出半个。副机位一般用手机支架固定,放在身体侧后方45度角,这个位置既能拍
?精准提分黑科技!ExamifyAI如何重塑2025考试备考模式?一、核心功能大揭秘:AI如何让考试准备更高效?ExamifyAI作为新一代智能考试平台,最吸引人的地方就是它的自适应学习引擎。这个系统就像一个贴心的私人教练,能根据你的答题数据自动调整学习路径。比如你在数学几何题上错误率高,系统会优先
你可能觉得公众号注册就是填几个信息的事,殊不知,这里面的每个选择都像蝴蝶扇动翅膀,未来三年的运营轨迹可能就被悄悄改变了。很多人刚开始没当回事,等到后面想调整,才发现处处受限,那叫一个后悔。今天就跟你好好聊聊,注册时那些看似不起眼的选择,到底能给未来的运营带来多大影响。📌账号类型选不对,三年运营路难
上周帮同事核查一篇AI写的行业报告,发现里面把2023年的用户增长率写成了2025年的预测数据。更离谱的是,引用的政策文件号都是错的。现在AI生成内容速度快是快,但这种硬伤要是直接发出去,读者信了才真叫坑人。今天就掰开揉碎了说,AI写作怎么做好事实核查,别让你的头条文章变成 误导重灾区 。📌AI写
🎯维度一:选题像打靶,靶心必须是「用户情绪储蓄罐」做内容的都清楚,10w+爆文的第一步不是写,是选。选题选不对,后面写得再好都是白搭。高手选选题,就像往用户的「情绪储蓄罐」里投硬币,投对了立刻就能听到回响。怎么判断选题有没有击中情绪?看三个指标:是不是高频讨论的「街头话题」?是不是藏在心里没说的「抽
📌135编辑器会员值不值得买?AI模板库和秀米H5谁更胜一筹?🔍135编辑器会员的核心价值解析企业级商用保障与效率提升135编辑器的企业会员堪称新媒体运营的「合规保险箱」。根据实际案例,某团队通过企业会员节省了大量设计费用,完成多篇内容创作,单篇成本从千元降至百元内。这得益于其海量正版模板和素材库,
新公众号被限流怎么办?粉丝增长影响分析及2025恢复指南🔍新公众号限流的核心原因解析新公众号被限流,往往是多个因素叠加的结果。根据2025年最新数据,超过70%的限流案例与内容质量直接相关。比如,有些新手喜欢用“震惊体”标题,像“惊!某公众号三天涨粉十万”,这类标题在2025年的算法里已经被明确标记
⚠️AI内容重复率高的3大核心原因现在用AI写东西的人越来越多,但很多人都会遇到同一个问题——重复率太高。明明是自己用工具生成的内容,一检测却显示和网上某些文章高度相似,这到底是为什么?最主要的原因是AI训练数据的重叠性。不管是ChatGPT还是国内的大模型,训练数据来源其实大同小异,都是爬取的互联
🌟135编辑器:公众号运营者的效率革命做公众号运营的朋友都知道,排版是个费时费力的活。一篇文章从内容到排版,没几个小时根本搞不定。不过现在好了,135编辑器的出现,彻底改变了这一现状。135编辑器是提子科技旗下的在线图文排版工具,2014年上线至今,已经成为国内新媒体运营的主流工具之一。它的功能非常
现在做内容的人几乎都离不开AI,但最头疼的就是原创度。平台检测一严格,那些模板化的AI文很容易被打回,甚至判定为“非原创”。但你知道吗?同样是用AI写东西,换个prompt指令词,原创度能差出天壤之别。我最近拿不同的prompt测了好几次,结果真的吓一跳——好的指令能让AI内容原创度直接从“及格线”