# aacr-bench **Repository Path**: newyear-ly/aacr-bench ## Basic Information - **Project Name**: aacr-bench - **Description**: An Alibaba open-source multi-language benchmark for evaluating LLMs in repository-level automatic code review, featuring an AI-assisted and expert-verified dataset. - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: main - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2026-03-16 - **Last Updated**: 2026-03-22 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README [//]: # (# AACR-Bench: 多语言、仓库级上下文感知的自动化代码评审评测数据集) 
200Pull Requests |
10编程语言 |
50源项目 |
2,145评审意见 |

### 数据格式
```json
{
"type": "array",
"item": {
"change_line_count": {"type": "integer", "description": "修改的行数量"},
"project_main_language": {"type": "string", "description": "项目主语言"},
"source_commit": {"type": "string", "description": "源commit"},
"target_commit": {"type": "string", "description": "目标commit"},
"githubPrUrl": {"type": "string", "description": "github 的pr地址"},
"comments": {
"is_ai_comment": {"type": "boolean", "description": "是否是AI评论"},
"note": {"type": "string", "description": "评论内容"},
"path": {"type": "string", "description": "文件路径"},
"side": {"type": "string", "description": "评论挂载位置"},
"source_model": {"type": "string", "description": "来源模型"},
"from_line": {"type": "integer", "description": "开始行号"},
"to_line": {"type": "integer", "description": "结束行号"},
"category": {"type": "string", "description": "问题分类:安全漏洞/代码缺陷/可维护性与可读性/性能问题"},
"context": {"type": "string", "description": "评论的作用域:diff级/文件级/仓库级"}
}
}
}
```
## 📏 评测指标
我们采用多维度指标体系全面评估代码审查模型的性能,完整的指标定义、计算方法和分语言统计请查看 [metrics.md](docs/zh/metrics.md)。
### 核心指标
| 指标 | 说明 | 计算公式 |
|----------------------------|-------------|-------------------|
| **准确率** (Precision) | 模型生成的有效评论占比 | `有效匹配数 / 生成总数` |
| **召回率** (Recall) | 发现标注集中问题的能力 | `有效匹配数 / 数据集中有效数` |
| **行级准确率** (Line Precision) | 精确定位到代码行的能力 | `行号匹配数 / 生成总数` |
| **噪声率** (Noise Rate) | 无效或错误评论的比例 | `未匹配数 / 生成总数` |
## 🤝 贡献指南
我们欢迎社区贡献!如果您想为 AACR-Bench 做出贡献,请按照以下步骤操作:
1. **Fork** 本仓库
2. **创建** 特性分支 (`git checkout -b feat/add-new-prs`)
3. **提交** 更改 (`git commit -m 'feat: add new PRs'`)
4. **推送** 到分支 (`git push origin feat/add-new-prs`)
5. **创建** Pull Request
详细贡献指南请参考 [CONTRIBUTING.md](CONTRIBUTING.zh-CN.md)
## 👥 作者与维护者
| 姓名 | GitHub | 负责领域 | 主要职责 |
|:--------|:---------------------------------------------------|:------|:---------------------|
| **李峥峰** | [@lizhengfeng](https://github.com/lizhengfeng101) | 项目负责人 | 总体架构设计、技术方向把控 |
| **王博格** | [@wangboge](https://github.com/wbgbg) | 技术顾问 | 技术方案评审、技术指导 |
| **张耒** | [@zhanglei](https://github.com/TongWu-ZL) | 数据架构 | 评测框架架构、指标体系设计、性能优化 |
| **于永达** | [@yuyongda](https://github.com/inkeast) | 评测系统 | 数据模式设计、评测协议制定、质量控制标准 |
| **郭欣欣** | [@guoxinxin](https://github.com/guoxinxin125) | 标注平台 | 标注系统开发、工作流设计、质量保证机制 |
| **余明晖** | [@yuminghui](https://github.com/yuminghui) | AI增强 | LLM标注流程、模型选择、提示工程优化 |
| **庄正奇** | [@zhuangzhengqi](https://github.com/ZhengqiZhuang) | 工程化 | CI/CD流程、自动化测试、部署脚本 |
## 📄 许可
本项目采用 Apache License 2.0 许可证,有关详细信息,请参阅 [LICENSE](LICENSE) 文件。
## 📚 引用
如果您在研究中使用了AACR-Bench,请引用我们的论文:
```bibtex
@misc{zhang2026aacrbenchevaluatingautomaticcode,
title={AACR-Bench: Evaluating Automatic Code Review with Holistic Repository-Level Context},
author={Lei Zhang and Yongda Yu and Minghui Yu and Xinxin Guo and Zhengqi Zhuang and Guoping Rong and Dong Shao and Haifeng Shen and Hongyu Kuang and Zhengfeng Li and Boge Wang and Guoan Zhang and Bangyu Xiang and Xiaobin Xu},
year={2026},
eprint={2601.19494},
archivePrefix={arXiv},
primaryClass={cs.SE},
url={https://arxiv.org/abs/2601.19494},
}
```
## 🗺️ 路线图
- [x] v1.0 (2026.01): 初始发布 - 200个PR,10种语言
## 🌟 致谢
- 感谢所有参与数据标注的贡献者,特别是完成15条以上有效标注的核心贡献者,完整名单见 [CONTRIBUTORS.md](CONTRIBUTORS.md)。
- 感谢提供原始PR数据的开源项目维护者。