# InternVL
**Repository Path**: www.ydj.com/InternVL
## Basic Information
- **Project Name**: InternVL
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: MIT
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-03-14
- **Last Updated**: 2026-03-14
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# InternVL家族:通过开源组件缩小与商业多模态模型的差距 —— GPT-5的开源替代方案
[\[🆕 博客\]](https://internvl.github.io/blog/)
[\[🤔 常见问题\]](https://internvl.readthedocs.io/en/latest/tutorials/faqs.html)
[\[🗨️ 对话Demo\]](https://chat.intern-ai.org.cn/)
[\[📖 文档\]](https://internvl.readthedocs.io/en/latest/)
[\[🌐 API\]](https://internlm.intern-ai.org.cn/api/document)
[\[🚀 快速开始\]](#使用-huggingface-快速开始)
[\[🔥 InternVL3.5 Report\]](https://huggingface.co/papers/2508.18265)
[\[📜 InternVL3.0 Report\]](https://huggingface.co/papers/2504.10479)
[\[📜 InternVL2.5 MPO\]](https://huggingface.co/papers/2411.10442)
[\[📜 InternVL 2.5 报告\]](https://huggingface.co/papers/2412.05271)
[\[📜 Mini-InternVL 论文\]](https://arxiv.org/abs/2410.16261)
[\[📜 InternVL2 博客\]](https://internvl.github.io/blog/2024-07-02-InternVL-2.0/)
[\[📜 InternVL 1.5 论文\]](https://huggingface.co/papers/2404.16821)
[\[📜 InternVL 1.0 论文\]](https://huggingface.co/papers/2312.14238)
[\[📖 2.0 中文解读\]](https://zhuanlan.zhihu.com/p/706547971) [\[📖 1.5 中文解读\]](https://zhuanlan.zhihu.com/p/699439759) [\[📖 1.0 中文解读\]](https://zhuanlan.zhihu.com/p/702946079)
[Switch to the English version (切换至英文版)](/README.md)


## 最新消息 🚀🚀🚀
- `2025/08/30`: 🔥 我们开源了[InternVL3_5-GPT-OSS-20B-A4B](https://github.com/OpenGVLab/InternVL/tree/main/internvl_chat_gpt_oss)以及CascadeRL(包含[离线强化学习](https://github.com/OpenGVLab/InternVL/blob/main/internvl_chat_gpt_oss/shell/internvl3_5_gpt_oss/internvl3_5_gpt_oss_20b_stage3_mpo.sh)和[在线强化学习](https://github.com/Weiyun1025/verl-internvl)两个阶段)的训练代码。这两个阶段的训练数据([MMPR-v1.2](https://huggingface.co/datasets/OpenGVLab/MMPR-v1.2)和[MMPR-Tiny](https://huggingface.co/datasets/OpenGVLab/MMPR-Tiny))也已经开源。
- `2025/08/26`: 🚀 我们发布了[InternVL3.5](https://huggingface.co/papers/2508.18265),一个在全面性、推理能力以及推理效率上都取得了全面提升的开源多模态模型系列。其中,最大的模型([InternVL3.5-241B-A28B](https://huggingface.co/OpenGVLab/InternVL3_5-241B-A28B))在开源多模态大语言模型中取得了最优的多模态感知、推理、语言以及agency性能。同时,我们基于OpenAI开源的GPT-OSS-20B-A4B也发布了一个20B-A4B的版本([InternVL3_5-GPT-OSS-20B-A4B](https://huggingface.co/OpenGVLab/InternVL3_5-GPT-OSS-20B-A4B-Preview))。值得注意的是,我们提供了两种模型权重的格式,包括和前几代权重格式一致的 [GitHub 格式](https://huggingface.co/OpenGVLab/InternVL3_5-GPT-OSS-20B-A4B-Preview#github-format)以及和`transformers`库格式一致的 [HuggingFace 格式](https://huggingface.co/OpenGVLab/InternVL3_5-GPT-OSS-20B-A4B-Preview#huggingface-format)。
- `2025/04/17`: 我们开源了 [MPO](https://huggingface.co/papers/2411.10442) 和 [VisualPRM](https://huggingface.co/papers/2503.10291) 的[数据构造管线](https://github.com/OpenGVLab/InternVL/tree/main/internvl_chat/tools/reasoning_data_pipeline)及[训练脚本](https://github.com/OpenGVLab/InternVL/tree/main/internvl_chat/shell/internvl3.0/mpo)。 此外 [MPO](https://github.com/OpenGVLab/InternVL/tree/main/internvl_chat/shell/internvl3.0/mpo_data_construction) 和 [VisualPRM](https://github.com/OpenGVLab/InternVL/tree/main/internvl_chat/shell/internvl3.0/visualprm_data_construction) 的数据构建脚本也已经开源。
- `2025/04/11`: 我们发布了 [InternVL3](https://huggingface.co/collections/OpenGVLab/internvl3-67f7f690be79c2fe9d74fe9d), 一个性能强大的开源多模态大模型。 其中 InternVL3-78B 同时在[感知能力](https://rank.opencompass.org.cn/leaderboard-multimodal/?m=REALTIME)和[推理能力](https://rank.opencompass.org.cn/leaderboard-multimodal-reasoning/?m=REALTIME)上同时达到了开源第一的性能。 InternVL3-78B 的核心技术包括:[Variable Visual Position Encoding](https://huggingface.co/papers/2412.09616),[Native Multimodal Pre-Training](https://huggingface.co/papers/2504.10479),[Mixed Preference Optimization](https://huggingface.co/papers/2411.10442),以及 [Multimodal Test-Time Scaling](https://huggingface.co/papers/2503.10291)。
- `2025/03/13`: 我们发布了 [VisualPRM](https://huggingface.co/OpenGVLab/VisualPRM-8B),一个8B参数两的多模态过程奖励模型(PRM)。该模型在 Best-of-8 的评测设置下使得 InternVL2.5-8B 和 InternVL2.5-78B 在七个多模态推理评测基准上的综合性能分别提升了 8.4 和 5.9 分。该模型的训练数据 [VisualPRM400K](https://huggingface.co/datasets/OpenGVLab/VisualPRM400K)也已经开源。请参考我们的[论文](https://huggingface.co/papers/2503.10291)和[项目主页](https://internvl.github.io/blog/2025-03-13-VisualPRM/)来了解更多细节。
- `2024/12/20`: 我们发布了 [InternVL2.5-MPO系列](https://internvl.github.io/blog/2024-12-20-InternVL-2.5-MPO/)。该系列通过 [Mixed Preference Optimization](https://huggingface.co/papers/2411.10442) 算法和 [MMPR-v1.1](https://huggingface.co/datasets/OpenGVLab/MMPR-v1.1) 数据集微调得到。**该系列模型在OpenCompass评测榜单中的整体性能超过MPO训练前两个百分点。** 这些模型可在 [HF 链接](https://huggingface.co/collections/OpenGVLab/internvl25-mpo-6753fed98cd828219b12f849)中下载。
- `2024/12/17`: Paddle团队已在[PaddleMIX](https://github.com/PaddlePaddle/PaddleMIX)框架中适配[InternVL2/2.5](https://github.com/PaddlePaddle/PaddleMIX/tree/develop/paddlemix/examples/internvl2)。
- `2024/12/05`: 我们发布了 InternVL2.5 系列,覆盖了从1B参数到78B参数的多模态大语言模型。[InternVL2_5-78B](https://huggingface.co/OpenGVLab/InternVL2_5-78B) 是首个在MMMU benchmark上得分超过70的开源模型。 这些模型可在 [HF 链接](https://huggingface.co/collections/OpenGVLab/internvl-25-673e1019b66e2218f68d7c1c) 中下载。
- `2024/11/14`: 我们发布了 [MMPR](https://huggingface.co/datasets/OpenGVLab/MMPR),一个高质量、大规模的多模态推理偏好数据集,以及 [MPO](https://github.com/OpenGVLab/InternVL/tree/main/internvl_chat/shell/internvl2.0_mpo),一种高效的偏好优化算法。由此训练的模型 [InternVL2-8B-MPO](https://huggingface.co/OpenGVLab/InternVL2-8B-MPO) 在 MathVista 上取得了 67.0 的准确率。更多详情请参阅我们的[论文](https://arxiv.org/abs/2411.10442)、[项目主页](https://internvl.github.io/blog/2024-11-14-InternVL-2.0-MPO/) 和 [文档](https://internvl.readthedocs.io/en/latest/internvl2.0/preference_optimization.html)。