照片变视频创意需求咋满足?AniPortrait 腾讯开源 AI 框架全功能解析

2025-07-05| 3160 阅读
现在想把静态照片变成会说话的动态视频,是不是觉得特别酷?腾讯开源的 AniPortrait 框架就能帮你实现这个创意。这个框架到底有多厉害?它能让照片里的人开口说话、做出各种表情,甚至还能根据音频调整动作。

AniPortrait 有两个核心模块,Audio2Lmk 和 Lmk2Video。Audio2Lmk 负责把音频转换成面部关键点序列,Lmk2Video 则根据这些关键点生成视频。简单来说,就是先分析音频里的语音和语调,然后把这些信息转化为面部动作,最后生成动态视频。

使用 AniPortrait 的第一步是安装和配置环境。你需要先克隆项目仓库,然后安装 Python 依赖。具体的命令是:

bash
git clone https://github.com/Zejun-Yang/AniPortrait.git
cd AniPortrait
pip install -r requirements.txt

接下来,你需要下载预训练模型,包括 StableDiffusion V1.5、sd-vae-ft-mse 等。这些模型会帮助你生成高质量的视频。

安装完成后,你就可以开始生成视频了。比如,你可以用以下命令生成一个音频驱动的视频:

bash
python -m scripts.audio2vid --config ./configs/prompts/animation_audio.yaml -W  -H  -acc

这里的 - W 和 - H 参数是设置视频的宽度和高度,-acc 参数可以加速生成过程。

AniPortrait 生成的视频质量非常高,人物的面部表情和口型都能和音频完美同步。比如,你输入一段演讲音频,生成的视频里的人会像真人一样说话,面部表情也会随着演讲内容变化。

AniPortrait 的应用场景非常广泛。在影视制作中,它可以把演员的照片变成动态替身,用于危险场景的拍摄。在游戏开发中,它可以快速生成 NPC 的对话动画,降低动作捕捉成本。在教育领域,它可以把教材中的人物插图变成动态讲解视频,提升学习趣味性。

不过,AniPortrait 也有一些小缺点。比如,生成的视频可能会有轻微的闪烁,这是扩散模型的通病。不过,你可以用 FFmpeg 的时域中值滤波器来减少闪烁:

bash
ffmpeg.exe -i input.mp4 -filter:v "tmedian=3" output.mp4

总的来说,AniPortrait 是一个非常强大的 AI 框架,它能让静态照片变成动态视频,满足各种创意需求。无论是专业开发者还是普通用户,都能通过 AniPortrait 释放创造力。如果你也想试试,不妨从克隆仓库开始吧!

该文章由dudu123.com嘟嘟 ai 导航整理,嘟嘟 AI 导航汇集全网优质网址资源和最新优质 AI 工具。

分享到:

相关文章

创作资讯2025-03-23

AI伪原创质量提升秘籍 | 从源头把控到后期润色,全面提升文章水平

📝 源头把控:给 AI 立好 “规矩”,输出质量先过半​​原始尺寸更换图片p9-flow-imagex-sign.byteimg.com​​很多人用 AI 写伪原创,上来就扔一句 “改写这篇文章”,

第五AI
创作资讯2025-06-25

Fooocus 怎么用?内置 GPT-2 提示引擎,SDXL 模型优化轻松生成艺术作品

? 轻松玩转 Fooocus:内置 GPT-2 提示引擎与 SDXL 模型优化,让艺术创作触手可及 作为一个专注于 AIGC 工具测评的老司机,我最近被一款名为 Fooocus 的 AI 绘图工具彻底

第五AI
创作资讯2025-07-15

可视化工具对比:欧洲数据门户如何提升数据驱动决策

? 欧洲数据门户可视化工具大起底:谁在真正赋能数据决策? 在数字时代的浪潮里,数据早就成了驱动政府治理和企业决策的核心燃料。欧洲作为数据开放和治理的先行者,各国的数据门户里藏着不少宝藏可视化工具。这些

第五AI
创作资讯2025-07-17

2025 萌番组升级亮点:界面简洁全平台适配二次元收藏功能详解

界面焕新:极简设计带来沉浸式体验 这一次萌番组的界面升级,绝对是给二次元爱好者们的一份大礼。原本略显拥挤的界面被彻底重构,所有冗余的元素都被剔除,取而代之的是清爽简洁的布局。打开 APP,首先映入眼帘

第五AI
创作资讯2025-06-30

免费用户每月 300 张 AI 图像生成,AI GENIUS 付费计划解锁高级功能详解

? 先聊聊 AI GENIUS 的免费计划 —— 真的能打! 说真的,现在市面上 AI 图像工具不少,但像 AI GENIUS 这样对免费用户敞亮的,真不多见。每月 300 张 AI 图像生成额度,完

第五AI
创作资讯2025-06-13

Todai AI 生活平衡工具深度解读:数据洞察定制化建议,助力工作自我关怀平衡

? Todai AI 生活平衡工具深度解读:数据洞察定制化建议,助力工作自我关怀平衡 现代人的生活就像被按了快进键,工作消息弹窗不断,待办事项清单越来越长,留给自己和家人的时间却越来越少。你是不是也常

第五AI
创作资讯2025-07-14

TigerGPT 值得用吗?基于 OpenAI 的实时股票分析与财报解读助手

? TigerGPT 值得用吗?基于 OpenAI 的实时股票分析与财报解读助手 在金融科技飞速发展的今天,AI 工具正逐渐渗透到投资决策的各个环节。TigerGPT 作为老虎证券推出的基于 Open

第五AI
创作资讯2025-06-17

Miro AI 思维导图生成与 AI 自动化功能:团队协作新方式

? Miro AI 思维导图生成:从空白画布到结构化思维,就差这一步 用过不下十种思维导图工具,说实话,大部分还停留在「手动搭框架」的阶段。直到上个月被逼着用 Miro AI 做项目脑暴,才发现 ——

第五AI