ubuntu下调用双卡Radeon VII 使用张量并行运行大语言模型(基于vllm)
最近更新: 8个月前GLM大模型客户端,一个独立的桌面应用程序,用于 glm,使用 Tauri 构建。 ## 功能 * **原生体验**:直接从桌面与 glm 交互,无需浏览器。 * **快速且轻量**:使用 Tauri 构建,应用程序资源占用少,启动迅速。 * **跨平台**:支持 Windows、macOS 和 Linux。
最近更新: 8个月前一个基于 JFinal 的国产微服务框架,SpringCloud 之外的另一个选择,已经使用在用户量过亿的商业产品上,目前有超过 1000 家公司在使用 Jboot 做极速开发...
最近更新: 9个月前本项目提供一个 HTTP API 服务,用于使用 Jina-embeddings-v3 模型生成文本嵌入,基于 ONNX Runtime 和 Robyn 框架。兼容openai embedding数据格式.支持在Cpu上运行.
最近更新: 1年前