# rest_api_bench **Repository Path**: tisandman/rest_api_bench ## Basic Information - **Project Name**: rest_api_bench - **Description**: 测试OVMS REST API性能 - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-03-10 - **Last Updated**: 2026-03-23 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # rest_api_bench #### 介绍 主要用于测试OVMS/ollama/llama.cpp的OpenAI API推理性能 #### 使用说明 1. 快速启动OVMS服务. 请参阅 [快速启动OVMS服务教程说明](./ovms_launcher/README.md) 获取更多信息。 2. llm_bench.py为benchmark脚本, python环境可以下载打包好的env_llm_bench.7z包 3. llm_bench.py会自动获取REST API服务的模型列表,自动匹配 4. 测试prompt从多个数据集提取切片 * 英文编程数据集 humaneval * 英文文章数据集 cnn-daily * 中文新闻数据集 [OpenDataLab](https://opendatalab.org.cn/OpenDataLab/OpenNewsArchive) * 中文小说数据集 [TigerResearch](https://hf-mirror.com/datasets/TigerResearch/pretrain_zh) * 英文编程数据集 [SWE-bench](https://huggingface.co/datasets/princeton-nlp/SWE-bench_Verified) * 自测中文1k~10k数据集: 1k~10k 中文prompt zw10k 5. llama.cpp的启动命令 (默认使用11434端口) ``` llama-server.exe -m ..\Qwen3-4B-Q4_K_M.gguf -c 32768 -fa on --no-mmap -ngl 99 -np 2 --port 11434 ``` 6. 已打包好的GenAI, OVMS, llm_bench的python环境 * 2026.0 (2026.3.1下载) - https://pan.baidu.com/s/1xi6Q3lKoLdpqENYWgaaVGg?pwd=wq65 提取码: wq65 - llm_bench的python环境 - env_llm_bench.7z - OpenVINO.GenAI 2026.0 - openvino_genai_windows_2026.0.0.0_x86_64.zip - OVMS 2026.0 - ovms_windows_python_on (2026.0.0.4d3933c5).zip #### benchmark工具使用方法 1. 运行 python llm_bench.py -help ``` usage: llm_bench.py [-h] -f {OVMS,LLAMA,OLLAMA} [-l LOOP] -ds DATASETS [DATASETS ...] [-g] Run benchmark with specified framework options: -h, --help show this help message and exit -f {OVMS,LLAMA,OLLAMA}, --framework {OVMS,LLAMA,OLLAMA} Framework to use, must be one of: OVMS, LLAMA, OLLAMA -ds DATASETS [DATASETS ...], --datasets DATASETS [DATASETS ...] Datasets to use, must be one or more of: humaneval, cnn-daily, openDataLab, TigerResearch, SWE-bench, zw10k -m MODEL, --model MODEL Specify model name directly, skipping model list retrieval from server ``` * -f 指定测试framework 可选择 OVMS, LLAMA, OLLAMA * -ds 选择测试的数据集名称,humaneval, cnn-daily, openDataLab, TigerResearch, SWE-bench, zw10k 可多选 例如 ``` # 测试humaneval和cnn-daily数据集 -ds humaneval cnn-daily ``` * -m 指定测试模型的名称 (因为ollama默认会获取到安装的所有模型的名称) * 完整命令示例 ``` python llm_bench.py -f LLAMA -ds openDataLab,TigerResearch python llm_bench.py -f OVMS -ds openDataLab,TigerResearch python llm_bench.py -f OLLAMA -ds CustomDB -m glm4 ``` * 测试结束后会在当前目录下生成包含TPS, TTFT, PP, TG性能数据的csv文件,以及包含详细输入输出信息log的子目录 ![](./res/bench_output.png) 文件summary_2026-0318-1449_Qwen3-4B-Q4_K_M.gguf-zw10k.csv 文件命名格式为 summary+'测试时间'+'模型名称'+'数据集名称'.csv 目录LLAMA_2026-0318-1449 目录命名格式为 '框架名'+'测试时间' **输出csv格式** ![](./res/csv_layout.png) #### 参与贡献 1. Fork 本仓库 2. 新建 Feat_xxx 分支 3. 提交代码 4. 新建 Pull Request #### 特技 1. 使用 Readme\_XXX.md 来支持不同的语言,例如 Readme\_en.md, Readme\_zh.md 2. Gitee 官方博客 [blog.gitee.com](https://blog.gitee.com) 3. 你可以 [https://gitee.com/explore](https://gitee.com/explore) 这个地址来了解 Gitee 上的优秀开源项目 4. [GVP](https://gitee.com/gvp) 全称是 Gitee 最有价值开源项目,是综合评定出的优秀开源项目 5. Gitee 官方提供的使用手册 [https://gitee.com/help](https://gitee.com/help) 6. Gitee 封面人物是一档用来展示 Gitee 会员风采的栏目 [https://gitee.com/gitee-stars/](https://gitee.com/gitee-stars/)