仓库 - mizunomk (mizunomk)

1

0

0

mizunomk/Otter

repository of Otter & Otter-HD

Python

最近更新：11个月前

1

0

0

mizunomk/Qwen2.5-VL

Qwen2.5-VL is the multimodal large language model series developed by Qwen team, Alibaba Cloud.

Python

最近更新：12个月前

1

0

0

mizunomk/InternVL

Python

最近更新：12个月前

1

0

0

mizunomk/imagededup

Finding duplicate images made easy!

Python

最近更新：1年前

1

0

0

mizunomk/DeepSeek-VL2

DeepSeek-VL2: Mixture-of-Experts Vision-Language Models for Advanced Multimodal Understanding

Python

最近更新：1年前

1

1

0

mizunomk/DDPM-PyTorch-1

PyTorch Implementation of 《Denoising Diffusion Probabilistic Models》

Python

最近更新：1年前

1

0

0

mizunomk/OLMo

Modeling, training, eval, and inference code for OLMo

Python

最近更新：1年前

1

0

0

mizunomk/megablocks

A light-weight library for mixture-of-experts (MoE) training. The core of the system is efficient dropless-MoE (dMoE) and standard MoE layers

最近更新：1年前

1

0

0

mizunomk/imagehash

A Python Perceptual Image Hashing Module

最近更新：1年前

1

0

0

mizunomk/OLMoE

OLMoE: Open Mixture-of-Experts Language Models

Python

最近更新：1年前

1

0

0

mizunomk/Aria

Codebase for Aria - An Open Multimodal Native MoE

Python

最近更新：1年前

1

0

0

mizunomk/LLaVA-NeXT

The repository forked from the official LLaVA-NeXT repository

Python

最近更新：1年前

1

0

0

mizunomk/lmms-eval

Accelerating the development of large multimodal models (LMMs) with one-click evaluation module - lmms-eval.

Python

最近更新：1年多前

1

0

0

mizunomk/VILA

VILA - a multi-image visual language model with training, inference and evaluation recipe, deployable from cloud to edge (Jetson Orin and laptops)

Python

最近更新：1年多前

1

0

0

mizunomk/Vary-toy

Implementation of Vary-toy (Small Language Model Meets with Reinforced Vision Vocabulary)

Python

最近更新：1年多前

1

0

0

mizunomk/MoE-LLaVA

Mixture-of-Experts for Large Vision-Language Models

Python

最近更新：1年多前

1

0

0

mizunomk/jepa

PyTorch code and models for V-JEPA self-supervised learning from video.

Python

最近更新：1年多前

1

0

0

mizunomk/ijepa

I-JEPA, First outlined in the CVPR paper, "Self-supervised learning from images with a joint-embedding predictive architecture"

Python

最近更新：1年多前

1

0

0

mizunomk/imp

A family of highly capable yet efficient large multimodal models

Python

最近更新：1年多前

1

0

0

mizunomk/Bunny

A family of lightweight multimodal models

Python

最近更新：1年多前

mizunomk

1 0 0 mizunomk/Otter

1 0 0 mizunomk/Qwen2.5-VL

1 0 0 mizunomk/InternVL

1 0 0 mizunomk/imagededup

1 0 0 mizunomk/DeepSeek-VL2

1 1 0 mizunomk/DDPM-PyTorch-1

1 0 0 mizunomk/OLMo

1 0 0 mizunomk/megablocks

1 0 0 mizunomk/imagehash

1 0 0 mizunomk/OLMoE

1 0 0 mizunomk/Aria

1 0 0 mizunomk/LLaVA-NeXT

1 0 0 mizunomk/lmms-eval

1 0 0 mizunomk/VILA

1 0 0 mizunomk/Vary-toy

1 0 0 mizunomk/MoE-LLaVA

1 0 0 mizunomk/jepa

1 0 0 mizunomk/ijepa

1 0 0 mizunomk/imp

1 0 0 mizunomk/Bunny

搜索帮助

1

0

0

mizunomk/Otter

1

0

0

mizunomk/Qwen2.5-VL

1

0

0

mizunomk/InternVL

1

0

0

mizunomk/imagededup

1

0

0

mizunomk/DeepSeek-VL2

1

1

0

mizunomk/DDPM-PyTorch-1

1

0

0

mizunomk/OLMo

1

0

0

mizunomk/megablocks

1

0

0

mizunomk/imagehash

1

0

0

mizunomk/OLMoE

1

0

0

mizunomk/Aria

1

0

0

mizunomk/LLaVA-NeXT

1

0

0

mizunomk/lmms-eval

1

0

0

mizunomk/VILA

1

0

0

mizunomk/Vary-toy

1

0

0

mizunomk/MoE-LLaVA

1

0

0

mizunomk/jepa

1

0

0

mizunomk/ijepa

1

0

0

mizunomk/imp

1

0

0

mizunomk/Bunny