# nexa-sdk **Repository Path**: efreets/nexa-sdk ## Basic Information - **Project Name**: nexa-sdk - **Description**: No description available - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-03-23 - **Last Updated**: 2026-03-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README
# NexaSDK **NexaSDK 让你用极低能耗打造最快、最聪明的本地 AI。** 它是一套高性能本地推理框架,只需几行代码即可在 Android、Windows、Linux、macOS 与 iOS 的 NPU、GPU、CPU 上运行最新的多模态 AI 模型。 NexaSDK 往往能比其他人提前数周甚至数月支持最新模型 —— Qwen3-VL、DeepSeek-OCR、Gemma3n(视觉版)等。 > ⭐ **star本仓库**,及时获取最新的本地 AI 能力更新与发布。 ## 🏆 重要里程碑 - **Qualcomm** 官方博客中 3 次重点介绍我们。 - [在 Qualcomm Hexagon NPU 上创新多模态 AI](https://www.qualcomm.com/developer/blog/2025/09/omnineural-4b-nexaml-qualcomm-hexagon-npu)。 - [Qualcomm Hexagon NPU 在计算与移动平台(汽车与 IoT)上的首个 Day-0 模型支持](https://www.qualcomm.com/developer/blog/2025/10/granite-4-0-to-the-edge-on-device-ai-for-real-world-performance)。 - [在 Snapdragon 手机上体验端侧 AI 的简单方式](https://www.qualcomm.com/developer/blog/2025/11/nexa-ai-for-android-simple-way-to-bring-on-device-ai-to-smartphones-with-snapdragon) - **Qwen** 为我们在 NPU、GPU、CPU 上 [Day-0 支持 Qwen3-VL](https://x.com/Alibaba_Qwen/status/1978154384098754943) 做了官方推荐。我们在 GGUF 支持上领先 Ollama 和 llama.cpp 3 周,并且目前只有我们支持 NPU。 - **IBM** 在[官方博客](https://www.ibm.com/new/announcements/ibm-granite-4-0-hyper-efficient-high-performance-hybrid-models)中,将 NexaML 推理引擎与 vLLM、llama.cpp、MLX 并列介绍,感谢我们 Day-0 支持 Granite 4.0。 - **Google** 认可我们对 EmbeddingGemma Day-0 的 NPU 支持([官方致谢](https://x.com/googleaidevs/status/1969188152049889511))。 - **AMD** 在[官方博客](https://www.amd.com/en/developer/resources/technical-articles/2025/advancing-ai-with-nexa-ai--image-generation-on-amd-npu-with-sdxl.html)报道我们在 AMD NPU 上实现 SDXL-turbo 图像生成。 - **NVIDIA** 在[官方博客](https://blogs.nvidia.com/blog/rtx-ai-garage-nexa-hyperlink-local-agent/)中介绍了由 NexaSDK 支撑的火爆本地 AI 应用 Hyperlink。 - **Microsoft** 在 Microsoft Ignite 2025 上台展示了我们作为[官方合作伙伴](https://www.linkedin.com/posts/mixen_excited-to-celebrate-our-developer-partnerships-activity-7396601602327007232-AmCR?utm_source=share&utm_medium=member_desktop&rcm=ACoAAChXnS8B4gqbBLUlWfwt-ck0XAv472NzT4k)。 - **Intel** 在[官方帖子](https://www.linkedin.com/posts/intel-software_ai-ondeviceai-nexasdk-activity-7376337062087667712-xw7i?utm_source=share&utm_medium=member_desktop&rcm=ACoAAChXnS8B4gqbBLUlWfwt-ck0XAv472NzT4k)中提到我们对 Intel NPU 的支持。 ## 🚀 快速开始 | 平台 | 链接 | | --------------- | ---------------------------------------------------------------------------------------------- | | 🖥️ CLI | [快速开始](#-cli) | [文档](https://docs.nexa.ai/en/nexa-sdk-go/NexaCLI) | | 🐍 Python | [快速开始](#-python-sdk) | [文档](https://docs.nexa.ai/en/nexa-sdk-python/overview) | | 🤖 Android | [快速开始](#-android-sdk) | [文档](https://docs.nexa.ai/en/nexa-sdk-android/overview) | | 🐳 Linux Docker | [快速开始](#-linux-docker) | [文档](https://docs.nexa.ai/en/nexa-sdk-docker/overview) | | 🍎 iOS | [快速开始](#-ios-sdk) | [文档](https://docs.nexa.ai/en/nexa-sdk-ios/overview) | --- ### 🖥️ CLI **下载:** | Windows | macOS | Linux | | -------------------------------------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------------- | -------------------------------------------------------------------------------------------- | | [arm64 (Qualcomm NPU)](https://public-storage.nexa4ai.com/nexa_sdk/downloads/nexa-cli_windows_arm64.exe) | [arm64 (Apple Silicon)](https://public-storage.nexa4ai.com/nexa_sdk/downloads/nexa-cli_macos_arm64.pkg) | [arm64](https://github.com/NexaAI/nexa-sdk/releases/latest/download/nexa-cli_linux_arm64.sh) | | [x64 (Intel/AMD NPU)](https://public-storage.nexa4ai.com/nexa_sdk/downloads/nexa-cli_windows_x86_64.exe) | [x64](https://public-storage.nexa4ai.com/nexa_sdk/downloads/nexa-cli_macos_x86_64.pkg) | [x64](https://github.com/NexaAI/nexa-sdk/releases/latest/download/nexa-cli_linux_x86_64.sh) | **运行你的第一个模型:** ```bash # 与 Qwen3 对话 nexa infer ggml-org/Qwen3-1.7B-GGUF # 多模态:在 CLI 中拖入图片 nexa infer NexaAI/Qwen3-VL-4B-Instruct-GGUF # NPU(Windows arm64,Snapdragon X Elite) nexa infer NexaAI/OmniNeural-4B ``` - **模型类型:** LLM、多模态、ASR、OCR、Rerank、目标检测、图像生成、Embedding - **格式:** GGUF、MLX、NEXA - **NPU 模型:** [Model Hub](https://sdk.nexa.ai/model) - 📖 [CLI 参考文档](https://docs.nexa.ai/en/nexa-sdk-go/NexaCLI) --- ### 🐍 Python SDK ```bash pip install nexaai ``` ```python from nexaai import LLM, GenerationConfig, ModelConfig, LlmChatMessage llm = LLM.from_(model="NexaAI/Qwen3-0.6B-GGUF", config=ModelConfig()) conversation = [ LlmChatMessage(role="user", content="Hello, tell me a joke") ] prompt = llm.apply_chat_template(conversation) for token in llm.generate_stream(prompt, GenerationConfig(max_tokens=100)): print(token, end="", flush=True) ``` - **模型类型:** LLM、多模态、ASR、OCR、Rerank、目标检测、图像生成、Embedding - **格式:** GGUF、MLX、NEXA - **NPU 模型:** [Model Hub](https://sdk.nexa.ai/model) - 📖 [Python SDK 文档](https://docs.nexa.ai/en/nexa-sdk-python/quickstart) --- ### 🤖 Android SDK 在 `app/AndroidManifest.xml` 中添加: ```xml图例: ✅ Supported | ⚠️ Partial or limited support | ❌ No