给大家分享整理的4个免费开源的AI数字人系统,从声音驱动、图片数字人对口型、数字人动作模仿到数字人直播,应有尽有。
AIGCPanel
AIGCPanel是一个简单易用的一站式AI数字人系统,小白也可上手。 支持视频合成、声音合成、声音克隆,简化本地模型管理、一键导入和使用AI模型。

软件基于 Apache-2.0 开源,永久免费,可以直接使用。
- 视频:视频合成、视频对口型、视频管理
- 声音:声音合成、声音克隆、声音管理
- 直播:数字人直播、语音直播、直播互动、一键使用
- 模型:本地模型、云端模型、模型一键启停

开源地址:https://gitee.com/modstart-lib/aigcpanel
官网地址:https://aigcpanel.com/
Heygem
硅基智能开源数字人模型,据说是全球TOP级数字人模型、好莱坞级数字人开源平台。1秒克隆生成4K视频,支持离线8种语言。

Heygem 是硅基智能推出的开源数字人模型,专为 Windows 系统设计。基于先进的AI技术,仅需 1 秒视频或 1 张照片,能在 30 秒内完成数字人形象和声音克隆,在 60 秒内合成 4K 超高清视频。Heygem支持多语言输出、多表情动作,具备 100% 口型匹配能力,在复杂光影或遮挡场景下能保持高度逼真的效果。Heygem 基于全离线运行模式,保护用户隐私,支持低配置硬件部署,极大地降低使用门槛,为内容创作、直播、教育等场景提供高效、低成本的数字人解决方案。
Gitee仓库:https://gitee.com/georgesu/HeyGem.ai
GitHub仓库:https://github.com/GuijiAI/HeyGem.ai
LatentSync
LatentSync是一款由字节跳动与北京交通大学联合开发的开源AI驱动视频唇形同步工具,项目不生成完整数字人,而是让声音和画面(尤其是唇形)完美匹配,是数字人技术的关键一环。

Latent Sync是一个由远见卓识的创作者团队开发的突破性成果,他们将AI、视频制作和机器学习方面的专业知识相结合,彻底革新了唇形同步技术。通过利用潜在扩散模型和尖端的TREPA方法,Latent Sync的创作者开发了一个用于生成动态、高质量唇形同步视频的端到端解决方案。这个强大的工具非常适合广泛的行业,从电影制作和游戏到虚拟形象和远程通信。
开始使用Latent Sync非常简单!按照这三个简单步骤:
第1步:上传您的视频和音频
首先上传您想要同步的视频和音频文件。Latent Sync可以处理任何视频素材,从虚拟形象到真人录像。只需选择您的内容,我们的系统将自动从视频和音频中提取唇形同步所需的必要特征。
第2步:生成高质量视频
Latent Sync将使用其强大的潜在扩散模型分析输入,应用最新的TREPA技术确保您的视频与音频同步。系统将保持高分辨率视频质量,确保动态、逼真的唇部运动与语音完美匹配,并保证没有任何帧差异的平滑时间一致性。
第3步:下载并分享
同步完成后,预览视频以确保它符合您的期望。Latent Sync提供完美的唇形同步和逼真的语音动画。预览后,您可以下载高分辨率视频,并轻松分享用于配音、虚拟形象、广告、游戏或任何创意项目。
开源地址:https://github.com/bytedance/LatentSync
官网地址:https://www.latentsync.org/zh
VideoReTalking
VideoReTalking项目由西安电子科技大学、腾讯AI实验室以及清华大学共同研发,旨在通过结合视频和音频文件,创造出人物嘴型与音频完美同步的全新视频,从而提升对话的真实感和自然度。

VideoReTalking项目的魅力在于其自动化和高效性。用户无需进行复杂的操作,只需提供视频和音频文件,系统便能自动完成对口型和面部增强。
Github地址:https://github.com/OpenTalker/video-retalking
原创文章,作者:howkunet,如若转载,请注明出处:https://www.intoep.com/ai/68383.html
微信赞赏
支付宝赞赏 