# MiniMates **Repository Path**: zhao105/MiniMates ## Basic Information - **Project Name**: MiniMates - **Description**: No description available - **Primary Language**: Unknown - **License**: Not specified - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-06-22 - **Last Updated**: 2025-06-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # MiniMates MiniMates 是一款轻量级的图片数字人驱动算法,比liveportrait、EchoMimic、MuseTalk等算法快10-100倍,支持语音驱动和表情驱动两种模式,并嵌入普通电脑实时运行,让用户能够定制自己的ai伙伴。 ## 🔥 更新日志 - **`2024/10/17`**:发布了最新release软件包吗,支持一键数字人实时对话,招呼你的AI伙伴! - **`2024/10/06`**:更新了相机实时表情驱动,使用mediapipe完成ARkit表情捕捉,请尝试interface/interface_face.py! - **`2024/10/04`**:发布了面部推理代码,支持旋转驱动、音频驱动和混合驱动。 - **`2024/09/24`**:发布了大模型语音对话原始程序及release包,在普通电脑上使用llama.cpp和edgeTTS完成实时语音对话。 ## Demo release image ![1730800572065](https://github.com/user-attachments/assets/9a836ad0-0446-4fe6-a7fb-9b801440bbc0) release video https://github.com/user-attachments/assets/d42b7893-34f1-422e-9027-b69110b97efa 旋转驱动-0 https://github.com/user-attachments/assets/787837b9-1c18-4303-82fa-a4c23cbd0e63 旋转驱动-0 https://github.com/user-attachments/assets/1a18e531-69c8-4b64-88a9-2b13bfb1c6fc 面部重演+语音驱动 https://github.com/user-attachments/assets/3bde6132-e541-4f4f-85b7-0a22bd2d97d1 ## 亮点 - **极速体验**:开源最快的数字人表情&语音驱动算法,没有之一。独立显卡、集成显卡,乃至CPU都可以实时。 - **个性化定制**:one-shot单图驱动,最低只需要一张图片。 - **嵌入终端**:摆脱python和cuda依赖。AI女友新生! ## To Do List - 集成至桌面软件 - 发布训练代码 - 实时相机表情驱动 - 人脸优化 - 上半身驱动 ## Usage 可以在这里获取预训练模型,并将其放在checkpoint目录下 百度网盘 https://pan.baidu.com/s/18stswLIZ0zyCcVWF7kTV7g?pwd=zosn (提取码:zosn) ### 创建环境 ```bash conda create -n MiniMates python=3.12 conda activate MiniMates pip install torch --index-url https://download.pytorch.org/whl/cu124 pip install -r requirements.txt ``` ### 人像抠图(可选) ```bash python interface/matting.py # eg: python interface/matting.py assets/01.jpg assets/01_rgba.png ``` output_path是你要保存的RGBA图片的位置。 例如: python interface/matting.py assets/01.jpg assets/01_rgba.png ### 用摄像头快速尝试 ```bash python interface/interface_face.py # eg: python interface/interface_face_rotation.py assets/01_rgba.png ``` 等待几秒钟让相机启动,你可以观测到图片的人物跟随你的头部来运动。 注意img_path必须是包含RGBA四通道的图片。 目前的表情驱动还不完善,所以谨慎使用,可能会获得不稳定但有趣的结果。使用的blendshape模版在checkpoint/bs_dict.pkl文件中,欢迎提出修改意见。 ### 用一个人物的视频当做表情模版 ```bash python interface/generate_move_template.py # eg: python interface/generate_move_template.py assets/driving.mp4 assets/driving.template ``` video_path是你找的模版视频,template_path则是要生成的模版文件位置。 ### 让图片人物按照语音文件和表情模版来生成视频 ```bash python interface/interface_audio.py # eg: python interface/interface_audio.py assets/01_rgba.png assets/audio.wav assets/output.mp4 assets/driving.template ``` template_path是可选项,若template_path不存在,那么人物就会在头部静止状态下说话。 ## 算法介绍 MiniMates 采用 coarse-to-fine 的 wrap network 架构,取代传统的 dense motion 方法,以实现在 CPU 上的性能提升。 此外,我们还使用 显式的 UV map 技术来提高人像的精度。 ![40ae6207dd3cbee4c0df7e6474fe1c5](https://github.com/user-attachments/assets/efb0e665-4b0b-4954-b4cc-e11b35651b2c) ## 速度 以下是 MiniMates 数字人算法在不同设备和推理框架下的fps表现(纯粹推理耗时): | 设备 | 推理框架 | fps | |--------------------|----------------|-----| | Intel i5 12600k | ncnn-cpu | 11 | | AMD Ryzen7 7735H | ncnn-cpu | 10 | | RTX4050 laptop | ncnn-vulkan | 119 | | mac m1 | ncnn-cpu | 36 | | RTX3080 | ncnn-vulkan | 100 | | Intel graphics 770 | ncnn-vulkan | 18 | | mac m1 | ncnn-vulkan | 66 | | RTX3080 | pytorch-gpu | 374 | ## 致谢 我们感谢以下开源项目的支持: - [face2face-rho](#) - [DH_live](#) - [sherpa-onnx](#) ## License MiniMates 数字人算法遵循 MIT 协议。 --- ## 联系 | 进入QQ群聊,分享看法和最新咨询。 | 加我好友,请备注“进群”,拉你进去微信交流群。 | |-------------------|----------------------| | ![QQ群聊](https://github.com/user-attachments/assets/23b1c431-2bf6-4198-8d32-d4b79a09c298) | ![微信交流群](https://github.com/user-attachments/assets/b1f24ebb-153b-44b1-b522-14f765154110) |