免费开源机器翻译API。自主托管,离线功能,易于设置。
来源:https://github.com/LibreTranslate/LibreTranslate
搬运:fastllm是后端无依赖的高性能大模型推理库。同时支持张量并行推理稠密模型和混合模式推理MOE模型,任意10G以上显卡即可推理满血DeepSeek。双路9004/9005服务器+单显卡部署DeepSeek满血满精度原版模型,单并发20tps;INT4量化模型单并发30tps,多并发可达60+
一个用于在C++中创建真实世界机器学习和数据分析应用的工具包
来源:https://github.com/davisking/dlib
gfpgan改良版,保持人脸角色特征,解决修复后被换脸问题
插帧工具,来源:https://github.com/ltkong218/IFRNet
IFRNet:用于高效帧穿插的中位特征精细网络(CVPR 2022)
需下载模型:https://www.dropbox.com/sh/hrewbpedd2cgdp3/AADbEivu0-CKDQcHtKdMNJPJa?dl=0
GFPGAN 本质是 "人脸超分+细节重建",非降噪模型。对非人脸噪声(如视频压缩块效应)效果有限。
Restormer:高效变压器,用于高分辨率图像修复。用于运动消模糊、图像去泪、去噪(高斯/真实数据)和去焦去模糊。
通过Swin-Conv-UNet和数据综合实现的实用盲图像去噪。用于真实图像去噪的新数据综合工作流
为方便访问引入,来源:https://github.com/modelscope/DiffSynth-Studio.git
与 ModelScope 深度集成,模型可直接从 ModelScope 或 Hugging Face 下载。
来源:https://github.com/modelscope/DiffSynth-Engine
方便访问
eSpeak NG 基于 eSpeak 引擎,由乔纳森·达丁顿 (Jonathan Duddington)创建,使用“共振峰合成”方法,开源软件文本转语音合成器,用于 Linux、Windows、Android 等作系统。它支持 100 多种语言和口音。
来源:https://github.com/espeak-ng/espeak-ng
Coqui TTS(原 Mozilla TTS),是一个用于高级文本转语音生成的库。
来源:https://github.com/coqui-ai/TTS/