# Auto-claude-code-research-in-sleep
**Repository Path**: AI4EarthLab/Auto-claude-code-research-in-sleep
## Basic Information
- **Project Name**: Auto-claude-code-research-in-sleep
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: MIT
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-05-23
- **Last Updated**: 2026-05-23
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# Auto-claude-code-research-in-sleep (ARIS ⚔️🌙)
[](https://huggingface.co/papers/2605.03042) · [](https://wanshuiyin.github.io/Auto-claude-code-research-in-sleep/ARIS_INTRO.html) · [](docs/aris_intro_slides.pdf) · [](AGENT_GUIDE.md) · [](https://mp.weixin.qq.com/s/tDniVryVGjDkkkWl-5sTkQ) · [](https://github.com/VoltAgent/awesome-agent-skills) · [-orange?style=flat)](https://aidigitalcrew.com) · [](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/stargazers) · [💬 加入交流群](#-交流群) · [](#-引用)
💡 *在 [Claude Code](https://docs.anthropic.com/en/docs/claude-code) / [Codex CLI](skills/skills-codex/) / [Cursor](docs/CURSOR_ADAPTATION.md) / [Trae](docs/TRAE_ARIS_RUNBOOK_CN.md) / [Antigravity](docs/ANTIGRAVITY_ADAPTATION_CN.md) / [GitHub Copilot CLI](docs/COPILOT_CLI_ADAPTATION.md) / [OpenClaw](docs/OPENCLAW_ADAPTATION.md) 里以 skill-based workflow 用 ARIS,或用独立 CLI 完整版体验——任你选!*
🌱 *ARIS 是方法论,不是平台。重要的是科研工作流——带着它去任何地方。*
🤖 **AI agent 兄弟们:** 直接读 [`AGENT_GUIDE.md`](AGENT_GUIDE.md) —— 给 LLM 消费的路由 index,不是给人浏览的。
🎯 **准备 2026 AI 秋招?** → [**🌐 ARIS-in-AI-Offer 网页版**](https://wanshuiyin.github.io/ARIS-in-AI-Offer/) · [GitHub repo](https://github.com/wanshuiyin/ARIS-in-AI-Offer) · [English](https://github.com/wanshuiyin/ARIS-in-AI-Offer/blob/main/README_EN.md) · 长文中文 ML / LLM / 多模态 / 生成式 / Agent 面试 cheat sheet 合集——每篇公式推导 + 从零 PyTorch 代码 + 25 高频面试题(L1 必会 / L2 进阶 / L3 顶级 lab),全部由 ARIS 的 `/render-html` workflow 自动生成。**希望大家秋招的时候轻松一点 🌱**


[English](README.md) | 中文版
> 🌙 **让 Claude Code 在你睡觉时做科研。** 醒来发现论文已被打分、弱点已被定位、实验已跑完、叙事已重写——全自动。
>
> 🪶 **极致轻量——零依赖,零锁定。** 整个系统就是纯 Markdown 文件。没有框架要学、没有数据库要维护、没有 Docker 要配、没有守护进程要看管。每个 skill 就是一个 `SKILL.md`,任何 LLM 都能读懂——换成 [Codex CLI](skills/skills-codex/)、[OpenClaw](docs/OPENCLAW_ADAPTATION.md)、[Cursor](docs/CURSOR_ADAPTATION.md)、[Trae](docs/TRAE_ARIS_RUNBOOK_CN.md)、[Antigravity](docs/ANTIGRAVITY_ADAPTATION_CN.md)、[Copilot CLI](docs/COPILOT_CLI_ADAPTATION.md)、Windsurf 或者你自己的 agent,工作流照样跑。Fork 它、改写它、适配到你的技术栈。
>
> *💡 ARIS 是方法论,不是平台。重要的是科研工作流——带着它去任何地方。🌱*
🔥 [**ARIS-Code CLI — 独立安装版**](docs/ARIS-Code-README_CN.md) · [English](docs/ARIS-Code-README_EN.md) | [⬇️ 下载](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/releases/latest)
> 📰 **ARIS-Code v0.4.5 → v0.4.11** (2026-05) — 7 个 release 集中提升:**新 provider** (DeepSeek V4 Pro / Xiaomi MiMo / Qwen 3.6 / Doubao / Custom OpenAI 兼容 / DashScope)、**推理模型 + tool-use 一等公民**(xhigh 真发到请求体,reasoning_content cache+replay,thinking blocks 全链路)、**流式 + MCP 可靠性**(关闭 [#228](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/228) / [#151](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/151) / [#172](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/172))、**多 provider 计费**、**Skills 包追平 main + sync infrastructure**(10 个新 skill, 46 个 SKILL.md 刷新, drift CI)、**关键 bug 修复**(PermissionMode 静默放过、写死 2026-03-31 日期、Custom reviewer 重置、第三方代理 signature 字段)。逐版本详情见下。贡献者:[@GetIT-Sunday](https://github.com/GetIT-Sunday)、[@Anduin9527](https://github.com/Anduin9527)、[@GO-player-hhy](https://github.com/GO-player-hhy)、[@Jxy-yxJ](https://github.com/Jxy-yxJ)、[@screw-44](https://github.com/screw-44)、[@StevenUST](https://github.com/StevenUST)。
>
> 逐版本详情(v0.4.5 → v0.4.11)
>
> **v0.4.11** (2026-05-18) — Skills bundle 刷新 + sync 基础设施。v0.4.10 binary 嵌入的 skills 已落后 main(56 个 main `skills/` commits 中只有 ~6 个被 cherry-pick 进 bundle);v0.4.11 sync 完整集合 + 落 sync infrastructure 防漂移再扩大。Bundle:65→74 个 user-facing skill,34→49 个 helper resource。新嵌入 10 个 skill:`/citation-audit`(第四层文献审计:存在性 + metadata + 引用 context)、`/experiment-queue`(SSH 多 seed 任务队列,含 OOM retry)、`/kill-argument`(理论论文双线对抗审)、`/resubmit-pipeline`(W5:纯文本换会议投稿)、`/paper-talk`(端到端 conference talk pipeline)、`/slides-polish`(逐页 Codex 排版审)、`/overleaf-sync`(双向 Overleaf Git-bridge)、`/gemini-search` + `/openalex`(更广文献源)、`/qzcli`(启智 GPU 任务)。46 个已有 SKILL.md 刷新——最关键是 canonical resolver chain 全面铺开(修复真实事故:硬编码 `tools/research_wiki.py` 让 `/research-wiki` 空了一周)+ submission assurance gate + external verifier(`/paper-writing` Phase 6 现在能跑通)。tools/ 9→18:9 个 baseline 刷新(`research_wiki.py` 从 315 行刷到 767 行含 canonical `ingest_paper` API)+ 9 个新增(`extract_paper_style.py`、`figure_renderer.py`、`paper_illustration_image2.py`、`overleaf_{setup,audit}.sh`、`verify_wiki_coverage.sh`、`watchdog.py`、`experiment_queue/{build_manifest,queue_manager}.py`)。新 `tools/sync_main_skills.sh` 自动化 main → bundle rsync(symlink 前置检测 + codex-mirror prune + `SKILLS_SOURCE_COMMIT` 钉版本)。`crates/runtime/src/cache.rs` 新增 3 个 CI drift test 覆盖全部 4 个 resolver layer pattern。`/research-lit` 和 `/gemini-search` 的 Gemini MCP 调用改成 `model: 'auto-gemini-3'`(避免 OAuth-personal 在 capacity 满时 silent downgrade 到 2.5-pro)。CLI runtime 行为不变——codex-audit P1 follow-up 留在 v0.4.12 backlog。Codex MCP(gpt-5.5 xhigh)5 轮交叉评审(REQUEST CHANGES → APPROVE WITH NITS → NO-GO → GO → final GO)。
>
> **v0.4.10** (2026-05-17) — 流式 + MCP 可靠性 + 多 provider 计费。C6 Anthropic `MessageStream` 和 OpenAI SSE 循环都支持 chunk decode 失败 / 早 EOF 时整段重启请求(`ARIS_STREAM_RETRY`,default 2,clamp 0..=5,仅在尚未输出任何内容时触发——关闭 [#228](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/228) "error decoding response body" 循环)。M3 MCP stdio 用 `tokio::time::timeout` 同时包 send + read(default 300s,env `MCP_REQUEST_TIMEOUT_SECS` clamp 1..=1800)+ `response.id ↔ request.id` 关联校验 + `ensure_server_ready()` `try_wait()` 检测死进程并 respawn + 任何失败路径 `kill().await` 让下次调用从干净状态开始(关闭 [#151](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/151) / [#172](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/172) "Calling codex..." 卡死)。C8/P4 OpenAI 流式请求加 `stream_options.include_usage:true` + 解析 `cached_tokens`;Anthropic 流式合并 `MessageStart.usage`(input/cache)和 `MessageDelta.usage`(output)。C9 多 provider 计费 registry(15+ 模型,OpenAI cache_read = input × 0.1 修正之前 generic 50% 高估 5×,DeepSeek cache_hit/cache_miss 分层,`has_word()` boundary matcher 让 `provider/` slug 走对 tier)。9 个 dead-code warning 修复;`aris setup` help 文案与实际行为同步。
>
> **v0.4.9** (2026-05-17) — 关闭 Codex v0.4.7 audit 三个 cross-cutting 残留(L1 TLS 双栈 / L3 reasoning_cache 错位 / L4 reasoning replay 无 cap)。2 个新 skill 嵌入(`/figure-spec` + `/paper-illustration-image2` 含 `scripts/` 子目录,新 Layer 0b = `$ARIS_CACHE_DIR/skills//scripts/`);`research_wiki.py` 提升到 shared `tools/`(9+ 调用方);5 个 SKILL.md 迁移到 fallback chain。
>
> **v0.4.8** (2026-05-17) — Skill helper 子系统重写。Bundled helper 在 startup 提取到 `~/.config/aris/cache//`;每次 Skill 调用输出 `helperReport` JSON + 4 层 resolver preamble;`/skills export` 一并导出 helper;新 `integration-contract.md` 含 6 个失败策略;8 个 shared helper(arxiv/deepxiv/exa/S2/openalex/save_trace/verify_papers/verify_paper_audits)嵌入;`/research-lit` + `/deepxiv` 迁移。另 4 个 bug 修复:gpt-5.5+tools 在 OpenAI 400;Custom reviewer 重启变 gpt-5.5;缺 `signature` 字段 ([#228](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/228));`--version` Build date 硬编码。
>
> **v0.4.7** (2026-05-16) — DashScope Coding Plan 405 修复 ([#159](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/159)) 通过 `native-tls` 切换 ([#225](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/225));所有 reasoning model 的 `reasoning_content` replay(不只 Kimi)([#226](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/226));600+ 行死代码 + `rustyline` 移除 + "Claw Code" → "ARIS-Code" 品牌统一。
>
> **v0.4.6** (2026-05-14) — 🚨 两个长期静默 bug 修复:`PermissionMode::Prompt` 因 derived-`Ord` 顺序错误一直在静默放过所有 tool;system prompt 硬编码 `current_date = "2026-03-31"` 让 model 把真实数据判为"未来 / prompt injection"。另 Custom OpenAI 兼容 provider(`/setup` 选项 11)+ dynamic `/models` 发现([@Anduin9527](https://github.com/Anduin9527) [#221](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/221) + [#222](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/222))。
>
> **v0.4.5** (2026-05-13) — 推理模型一等公民支持:thinking content blocks 全链路(修 [#161](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/161))+ `reasoning_effort='xhigh'` 真正发到 GPT-5.5 / o1 / o3 / o4 / DeepSeek-thinking。DeepSeek V4 Pro + Xiaomi MiMo + Qwen 3.6 + Doubao 加入 `/setup`(选项 7-10)。对象式 hooks 解析器。默认模型升级 Claude Opus 4.7 + GPT-5.5。REPL 输入加固(折行 / Cmd+V 粘贴 / CJK 边界)。新增 GitHub Actions CI workflow。贡献者:[@GO-player-hhy](https://github.com/GO-player-hhy) ([#186](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/186))、[@Jxy-yxJ](https://github.com/Jxy-yxJ) ([#171](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/171))、[@GetIT-Sunday](https://github.com/GetIT-Sunday) ([#216](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/216) 部分)。
>
>
> 更早历史版本
>
> **v0.4.4** (2026-04-20) — Setup UX + reviewer 路由修复(修 [#158](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/158) / [#162](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/162))| Anthropic + 自定义 URL 不再强制 Bearer | LlmReview 智能 fallback
>
> **v0.4.3** (2026-04-17) — 第三方 Anthropic-compat 代理支持(Bedrock 等)| 致谢 [@screw-44](https://github.com/screw-44)
>
> **v0.4.2** (2026-04-17) — Auto-compaction 修复 | OpenAI-compat 摘要保留 | Shell API key 不再被清
>
> **v0.4.1** (2026-04-15) — Plan 模式 + Ctrl+C 协作中断 + 自动重试 (429/5xx) | 多文件 Memory
>
>
基于 [Claude Code](https://docs.anthropic.com/en/docs/claude-code) 的自定义 Skills,用于自主 ML 科研工作流。核心机制是**跨模型协作**——Claude Code 负责执行(读文件、写代码、跑实验、收结果),外部 LLM(通过 [Codex MCP](https://github.com/openai/codex))负责评审(打分、找弱点、建议修复)。两个模型互不评自己的作业,形成真正的反馈循环。🔀 **也支持[替代模型组合](#-替代模型组合)(Kimi、LongCat、DeepSeek 等)——无需 Claude 或 OpenAI API。** 例如 [MiniMax-M2.7 + GLM-5 或 GLM-5 + MiniMax-M2.7](docs/MiniMax-GLM-Configuration.md)。 🤖 **[Codex CLI 原生版](skills/skills-codex/)** — 完整 skill 集合也支持 OpenAI Codex。🖱️ **[Cursor](docs/CURSOR_ADAPTATION.md)** — Cursor 也能用。🖥️ **[Trae](docs/TRAE_ARIS_RUNBOOK_CN.md)** — 字节跳动 AI IDE。🚀 **[Antigravity](docs/ANTIGRAVITY_ADAPTATION_CN.md)** — Google Agent-First IDE。🐙 **[Copilot CLI](docs/COPILOT_CLI_ADAPTATION.md)** — GitHub 终端 Agent(原生 SKILL.md + MCP)。🆓 **[ModelScope 免费接入](docs/MODELSCOPE_GUIDE.md)——零成本,零锁定。**
> 💭 **为什么不用单模型自我博弈?** 用 Claude Code 的 subagent 或 agent team 同时做执行和审稿在技术上可行,但容易陷入**局部最优**——同一个模型审自己的输出会产生盲区。
>
> *类比 bandit 问题:单模型自审是 stochastic bandit(噪声可预测),跨模型审稿则是 adversarial bandit(审稿者会主动探测执行者未预料的弱点)——而 adversarial bandit 天然更难被 game。*
>
> 💭 **为什么是两个模型而不是更多?** 两个是打破自我博弈盲区的最小配置,且双人博弈收敛到 Nash 均衡的效率远高于多人博弈。增加更多审稿者只会增加 API 开销和协调成本,边际收益递减——最大的提升来自 1→2,而非 2→4。
>
> Claude Code 的优势是快速丝滑的执行,Codex(GPT-5.4 xhigh)虽然慢但审稿更严谨深入。两者**速度 × 严谨**的互补特性,比单模型自我对话效果更好。
>
> 🧿 **想要最强审稿者?** 任何 skill 加 `— reviewer: oracle-pro` 即可通过 [Oracle MCP](https://github.com/steipete/oracle) 调用 **GPT-5.4 Pro**。Pro 级推理能力适合证明验证、实验审计和最终 stress test。支持 API key 或免费浏览器模式。[设置 →](#-可选gpt-54-pro-via-oracle)
## 🎯 不止一句 Prompt
**基础模式** — 给 ARIS 一个研究方向,全自动:
```
/research-pipeline "离散扩散语言模型的 factorized gap"
```
**🔥 精准模式** — 有篇论文想改进?把论文 + 代码给 ARIS:
```
/research-pipeline "改进方法 X" — ref paper: https://arxiv.org/abs/2406.04329, base repo: https://github.com/org/project
```
ARIS 读论文 → 找弱点 → 克隆代码 → 针对*那些*弱点用*那套*代码生成改进方案 → 跑实验 → 写论文。就像跟研究助手说:*"读这篇论文,用这个 repo,找出哪里不行,然后修好它。"*
> 自由组合:`ref paper` 单独 = "这篇论文哪里能改进?",`base repo` 单独 = "这个代码能做什么?",两个都给 = "用*这个*代码改进*这篇*论文。"
**🔥 Rebuttal 模式** — 审稿意见来了?别慌。ARIS 读每条意见、制定策略、起草安全的 rebuttal:
```
/rebuttal "paper/ + reviews" — venue: ICML, character limit: 5000
```
三道安全门:
- 🔒 **不编造** — 每句话有出处
- 🔒 **不过度承诺** — 没批准的不承诺
- 🔒 **全覆盖** — 每个审稿意见都追踪
两版输出:`PASTE_READY.txt`(精确字数,直接粘贴)+ `REBUTTAL_DRAFT_rich.md`(详细版,自己改)
展开 rebuttal 参数 —— venue、character limit(必填)、quick mode、auto experiment、压测轮数、follow-up 上限
| 参数 | 默认值 | 作用 |
|------|--------|------|
| `venue` | `ICML` | 目标会议 |
| `character limit` | — | **必填。** 字符限制 |
| `quick mode` | `false` | 仅解析 + 策略(Phase 0-3),先看审稿人要什么 |
| `auto experiment` | `false` | 自动跑补充实验(`/experiment-bridge`) |
| `max stress test rounds` | `1` | GPT-5.4 压力测试轮数 |
| `max followup rounds` | `3` | 每个 reviewer follow-up 上限 |
**中稿之后** — 论文录了,准备展示:
```
/paper-slides "paper/" # → Beamer PDF + PPTX + 演讲稿 + Q&A 预案
/paper-poster "paper/" # → A0/A1 海报 PDF + 可编辑 PPTX + SVG
```
> *💡 从 idea 到论文到讲台到 rebuttal——一条工具链。🌱*
> 以上是全流程——你也可以单独用任何一个工作流。已有 idea?直接进工作流 1.5。有结果了?跳到工作流 3。见[快速开始](#-快速开始)查看所有命令,[工作流](#-工作流)了解完整流程。
## 📢 最近更新
- **2026-05-17** —  🐙 **[GitHub Copilot CLI 适配](docs/COPILOT_CLI_ADAPTATION.md)** —— 原生 `SKILL.md` + MCP 支持,无需 skill mirror。安装器(`install_aris_copilot.sh`)+ smart-updater + 13 个 pytest。社区贡献 by [@EarendelH](https://github.com/EarendelH)([#229](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/229),关闭 [#214](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/214) / [#227](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/227) / [#203](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/203))。
- **2026-05-17** —  🛠 **Tools-stability roadmap (Phase 1+2+3) 完整收尾**(closes [#176](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/176) / [#177](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/177) / [#178](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/178))。社区反馈 `install_aris.sh` 跑完但 helper script 在用户项目里找不到。**Phase 1** —— 10 个 canonical helper 的所有 SKILL.md 调用方现在统一通过 [`integration-contract.md`](skills/shared-references/integration-contract.md) §2 定义的 3 层链 `.aris/tools/` → `tools/` → `$ARIS_REPO/tools/` 解析(§2 同时定义 5 种 failure policy A/B/C/D1/D2/E)。**Phase 2** —— 新增 [advisory CI lint](.github/workflows/lint-skills-helpers.yml) 在 PR 扫硬编码 `python3 tools/foo.py` 模式(仅警告,**永不卡 CI**)。**Phase 3** —— 3 个 single-owner helper(`figure-spec`、`paper-illustration-image2`、`experiment-queue`)迁入对应 SKILL 的 `scripts/` 目录,owner SKILL 用 Layer 0 `${CLAUDE_SKILL_DIR}/scripts/` 优先于 canonical chain,原 `tools/` 路径保留 `os.execv` Python 转发 shim。**⚠️ 现有用户**:无需操作,legacy `tools/` 入口现在是转发 shim。如果 2026-04-30 之后没跑过 `install_aris.sh`,幂等重跑一次即可全部对齐。
- **2026-05-14** —  🩹 **`/paper-plan` + `/paper-write` 学会 `GAP_REPORT.md` + `` 规则** ([#217](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/217))。当 `— style-ref:` 启用且用户项目下存在结构性 assets(`figures/`、`results/`、`NARRATIVE_REPORT.md` 等)时,`/paper-plan` emit **Gap Report**,把 exemplar 的 section 拓扑 + 密度(从 `style_profile.md`)对照用户实际 assets,暴露**没有证据填充**的结构性槽位(如"exemplar 有 3×4 ablation 表,你没有 ablation 数据")。然后 `/paper-write` 在 missing 槽位写 `` HTML 注释**而不是编造内容**——PDF 不可见,`grep` 友好供人审 triage / `/experiment-bridge` 后续补实验。是对默认"no placeholders"规则的窄 carve-out,只在 GAP_REPORT 列出的 missing 槽位生效。原始想法来自 [@zhangpelf](https://github.com/zhangpelf)。
更早的更新(2026-03-12 — 2026-05-14,55 条)
- **2026-05-14** —  ⚙️ **默认 reviewer 模型:`gpt-5.4` → `gpt-5.5`**,覆盖 ~30 个 SKILL.md `REVIEWER_MODEL` 默认值。Codex MCP 自 2026-04-24 起 runtime 就是 `gpt-5.5`,本次让文档对齐 runtime。**⚠️ 行为变化**:(a) 之前 run 留下的 `.aris/traces/*` JSON **不可复现**——重跑用 5.5,边界 case 可能给出不同的 `WARN/FAIL` 判决(reviewer 质量提升,不是回归)。(b) ChatGPT Plus/Pro 月度配额在重度使用下消耗更快。**回退**:单次调用传 `— reviewer-model: gpt-5.4`,或在 skill 文件里固定 `REVIEWER_MODEL = gpt-5.4`。Oracle Pro tier(`— reviewer: oracle-pro`)走独立路由,不受影响。
- **2026-05-13** —  🔍 **[`tools/verify_papers.py`](tools/verify_papers.py) + Pre-Search Verification Protocol —— 给文献类 skill 加反幻觉过滤**。新 helper 走 3 层 fallback 验证(arXiv batch API 每次最多 40 个 ID → CrossRef DOI 查询 → Semantic Scholar 模糊标题匹配,默认 0.6 词重叠阈值),每篇 paper 输出 4 态(`verified` / `unverified` / `verify_pending` / `error`),顶层 verdict 对齐 `assurance-contract.md`(`PASS` / `WARN` / `BLOCKED` / `ERROR`)。**关键设计点**:网络瞬时失败(5xx、超时、429)单独标 `verify_pending` 且**不计入幻觉率**,避免网络挂被当成伪造引用。per-project 缓存路径 `/.aris/cache/verify_papers.json`,30 天 TTL;缓存键优先级 `arxiv:{id_去版本号}` → `doi:{小写}` → `title:{sha1[:16]}`。[`shared-references/citation-discipline.md`](skills/shared-references/citation-discipline.md) 新增 `Pre-Search Verification Protocol` 小节,明确 search-time vs write-time 分工:本协议是 SEARCH(Step 1)和完整 VERIFY(Step 2)之间的**快速过滤器**;`/citation-audit` 和 `/paper-claim-audit` 仍是 submission 时的硬性 audit gate,**没被替代**。[`/research-lit`](skills/research-lit/SKILL.md) 新增 mandatory `Step 1.5: Verify Candidate Papers` 调 helper;[`/idea-creator`](skills/idea-creator/SKILL.md) 和 [`/novelty-check`](skills/novelty-check/SKILL.md) 各加 1 行 Key Rule 引用,覆盖 landscape 引用和 Closest Prior Work 表格。**保留而非静默删除**:未验证 paper 留在输出里打 `[UNVERIFIED]` 标记,让搜索质量问题对用户可见。可选:shell 里 `export ARIS_VERIFY_EMAIL=you@institution.edu` 进 CrossRef polite-pool 提高速率。最初由 [@YiwenZhu77](https://github.com/YiwenZhu77) 在 [#120](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/120) 提出——做了干净重写而非直接合 PR(PR 5 周老 + scope creep 到 figure-style)。
- **2026-05-06** —  🎤 **[`/paper-talk`](skills/paper-talk/SKILL.md) workflow + [`/slides-polish`](skills/slides-polish/SKILL.md) skill —— 端到端 conference talk pipeline**。`/paper-talk` 编排 paper → slide outline → Beamer + PPTX → per-page polish → assurance 审计 → final report(`/paper-writing`、`/paper-poster` 的姊妹 workflow);组合 `/paper-slides`、`/slides-polish`,`assurance: conference-ready` 时再叠 `/paper-claim-audit` + `/citation-audit`。`/slides-polish` 是 post-generation 视觉打磨阶段:per-page Codex 对照 reference PDF 一页一页审 + 一套针对性 python-pptx / Beamer fix pattern(PPTX 字号 1.5-1.8× 缩放保证投影可读、字号 bump 后 text frame resize、banner 真用 tcolorbox 而不是 centered text、italic style 泄漏防御、em-dash 间距、中文 EA font hint 走 PingFang SC、anonymity placeholder 纪律)。Assurance 阶梯 `draft / polished(默认)/ conference-ready` 与 effort 轴正交——`effort: lite, assurance: conference-ready` 合法,意为「快流水线 + 每个审计必出 verdict 才能 final」。Phase 4 staging adapter 把 slide 文字 + 讲稿 + 完整 script 物化成合成 paper 目录(`.aris/paper-talk/audit-input/sections/*.tex` + symlink 真实 `.bib` / `results/` / `figures/`),让现有 `/paper-claim-audit` 和 `/citation-audit` 用它们 paper-shaped 合约审 talk 内容,输出 6 态 JSON verdict(见 `shared-references/assurance-contract.md`)。
- **2026-05-05** —  🔁 **`/resubmit-pipeline` —— Workflow 5:跨 venue 文本-only 重投流程** ([#208](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/208))。把已经打磨好的 paper 从一个 venue 移到另一个,硬约束:不跑新实验、不改 bib、不动 framework、不覆盖任何先前 submission 目录。5 阶段:物理隔离 → 5 层匿名检查 → 三审(proof / claim / citation `--soft-only`)→ `/auto-paper-improvement-loop --edit-whitelist` 微编辑 + 每轮 diff gate → `/kill-argument` 对抗 gate → 终编译 + `/overleaf-sync` 推送。同 PR 一起落地两个前置 skill 升级:**`/auto-paper-improvement-loop --edit-whitelist `**(YAML schema,含 `allowed_paths` / `forbidden_paths` / `forbidden_operations`(如 `new_cite` / `new_theorem_env` / `numerical_claim`)/ `forbidden_deletions` / `requires_user_approval_for` / `max_edits_per_round`)和 **`/citation-audit --soft-only`**(bib 冻结时把 KEEP/FIX/REPLACE/REMOVE 翻译成文本改写建议;hallucinated 引用走 `drop_cite_in_body_only` 动作)。Master `RESUBMIT_REPORT.json` ledger 兼容 `shared-references/assurance-contract.md`;7 态 verdict 表(含 `USER_DECISION` runtime 状态)。
- **2026-05-05** —  🗡 **`/kill-argument` —— 理论论文的对抗式 Attack-Adjudication review** ([#206](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/206))。两个新鲜 codex 5.5 + xhigh thread:Thread 1 写senior area chair 会写的最强 200 字 rejection memo;Thread 2 是独立 adjudicator(**不是** paper 的辩护人),读当前 paper 把每个攻击点分类为 `answered_by_current_text` / `partially_answered` / `still_unresolved`,带 file:line evidence。输出 `KILL_ARGUMENT.{md,json}`,detect-only。集成为 `/paper-writing` 的 **Phase 5.6**(在 claim-audit 和 citation-audit 之间),同时作为 `/auto-paper-improvement-loop` Step 5.5 的 canonical 调用——两处都不再内嵌 prompt 模板。`assurance: submission` 时对理论/scope-heavy paper 强制运行;非理论纯 empirical paper 自动 emit `NOT_APPLICABLE`。审计 JSON 兼容 `verify_paper_audits.sh`(完整 schema 见 `shared-references/assurance-contract.md`,6 态 verdict)。补 score-based review 漏掉的失败模式:每个 local 组件都对(数字对、引用对、定理证)但论文整体还是 oversell 了它真正证明的东西。
- **2026-05-04** —  🪲 **`/research-wiki` 和 8 个调用方 skill 改用 fallback chain 解析 helper** ([#204](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/204))。Bug:跑过 `bash tools/install_aris.sh` 后 helper 在 `.aris/tools/research_wiki.py`(symlink),但 skill 写死了 `tools/research_wiki.py`,调用时 silently 失败——整个 W1 跑完 `research-wiki/` 一直是空的。修复:3 层 chain(`.aris/tools/` → `tools/` → `$ARIS_REPO/tools/`),canonical pattern 在 [`shared-references/wiki-helper-resolution.md`](skills/shared-references/wiki-helper-resolution.md)。手动 `cp` 到 `/tools/research_wiki.py` 的临时方案是 chain 第二层,照常 work。**⚠️ 已装 ARIS 用户**:重跑一次 `bash tools/install_aris.sh`——同时拿到 helper 的 Python 3.9 `ImportError` 修复(独立 bug)。
- **2026-05-03** —  🎨 **写作类 skill 的 opt-in `— style-ref: ` 参数** ([#202](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/202))。`/paper-{plan,write,writing,illustration,poster,slides}`、`/grant-proposal`、`/auto-paper-improvement-loop` 接受可选的 `— style-ref: ` 参数,**模仿参考论文的结构性风格**(section 顺序、theorem/figure 密度、句长节奏、引用风格),但**不复制其 prose / claim / 术语**。支持的 source:本地 `.tex` 目录/文件、本地 PDF、arXiv id(`2501.12345` 或 `arxiv:2501.12345`)、HTTP/HTTPS URL。Overleaf URL/ID 会被拒绝——先 `/overleaf-sync setup ` 把项目 clone 到本地再传路径。**默认关闭**;不传参数时所有 8 个 skill 行为完全不变。Reviewer / auditor 子 skill(`/proof-checker`、`/paper-claim-audit`、`/citation-audit`、improvement-loop reviewer)永远拿不到 style ref——跨模型 review 独立性保留。**⚠️ 已安装 ARIS 的用户**:helper 是新的 `tools/extract_paper_style.py`,通过 `.aris/tools` symlink 分发(`install_aris.sh` Phase 0,[#192](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/192) 引入)。**重跑一次 `bash tools/install_aris.sh`** 刷新 symlink 即可拿到 helper。手动 fallback:`cp /tools/extract_paper_style.py <你的项目>/tools/`。两者都没做的话,writer skill 会 abort 并给清晰错误指向这条 News
- **2026-05-02** —  🪨 **社区项目推荐:[rosetta](https://github.com/SyntaxSmith/rosetta)** by [@SyntaxSmith](https://github.com/SyntaxSmith)。Node 程序化访问 **ChatGPT Pro / `gpt-5.5-pro` / DeepResearch**——Chrome CDP Fetch 拦截 + WebSocket second-leg streaming;自带 MCP server(Claude Code / Codex / Cline)。是 ARIS 用户 `— reviewer: oracle-pro` 调高 tier reviewer 的另一种实现路径——同样的能力目标(Pro 级 reviewer),不同机制。已收录到[社区 Skills & 扩展](#-awesome-社区-skills--扩展)。觉得有用 🌟 一下!
- **2026-05-02** —  💎🧿 **Model & MCP routing 更新**。(a) [`/gemini-search`](skills/gemini-search/SKILL.md) 默认升级到 `gemini-3-pro-preview`(最强 Gemini 开箱默认)。⚠️ **需要操作**:需要 `gemini-cli` v0.40+(`gemini --version` 查版本;老版本 `npm i -g @google/gemini-cli` 升级)。Legacy override:`/gemini-search "topic" — model: gemini-2.5-pro`。其他 override:`gemini-3-flash-preview`(更快)、`auto-gemini-3`(按负载 route)。(b) [`/idea-discovery`](skills/idea-discovery/SKILL.md) Phase 1 现在默认包含 Gemini 文献检索 ([#199](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/199))——除非用户显式传 `— sources:`,否则给 `/research-lit` 自动注入 `— sources: all, gemini`;没装 `gemini-cli` 时优雅 skip。(c) Oracle MCP 上游 PR 队列([`steipete/oracle/pulls`](https://github.com/steipete/oracle/pulls))是用 `— reviewer: oracle-pro`(尤其 `o3-deep-research` / `gpt-5.5-pro`)时**开 issue 之前的第一排查点**——ARIS 不 vendor Oracle MCP,你跑的是 `@steipete/oracle` npm 发布版([reviewer-routing.md](skills/shared-references/reviewer-routing.md))
- **2026-05-02** —  🛠️🔗 **Tools-infrastructure 迁移启动**。(a) [`install_aris.sh`](tools/install_aris.sh) 创建可选 `.aris/tools` 符号链接 ([#192](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/192), 关闭 [#174](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/174))——4 步 tools-stability 迁移(#174 → #176 → #177 → #178)的 Phase 0;幂等,**对老用户零影响**直到 rerun installer。(b) [`/experiment-queue`](skills/experiment-queue/SKILL.md) 编排路径修复 ([#193](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/193))——symlink 第一个真实用户;修了 7 个串联 bug,3 轮 Codex MCP `gpt-5.5` xhigh review 抓出 cascade。纯 prose + docstring;`queue_manager.py` Python 逻辑未动。Windows `install_aris.ps1` 平行更新作为 follow-up
- **2026-05-02** —  🔬 **三个 opt-in audit flag 通过 fast-path delegated-agent 工作流落地** ([#187](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/187), [#188](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/188), [#189](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/189))。[`/citation-audit --uncited`](skills/citation-audit/SKILL.md) 扫出 bib 里没人 `\cite{}` 的死条目(纯检测)。[`/proof-checker --deep-fix`](skills/proof-checker/SKILL.md) 给 Phase 1 reviewer prompt 加 repair-grade 修复计划(corrected_statement / patch plan / closure tests + Schur/quadratic-form 代数 sanity)。[`/proof-checker --restatement-check`](skills/proof-checker/SKILL.md) 加 Phase 3.6 跨位置定理飘移检测(6 类 drift signature)。**flag 不传时零行为变化**。同期合了两条文档 PR([#190](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/190) thread-policy / [#191](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/191) auto-loop xref)。delegated-agent + maintainer-fixup 模式;Codex MCP `gpt-5.5` xhigh review 抓出 6+ 个 blocker
- **2026-05-01** —  🔍 **`/research-lit` 新增 Gemini + OpenAlex 文献源** ([#175](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/pull/175),社区贡献 [@stdAri](https://github.com/stdAri))。两个 opt-in 源:[`/gemini-search`](skills/gemini-search/SKILL.md)(AI 驱动的广覆盖检索,走 [`jamubc/gemini-mcp-tool`](https://github.com/jamubc/gemini-mcp-tool) MCP)+ [`/openalex`](skills/openalex/SKILL.md)(2.5 亿+ 条目开放引用图,免 API key)。`— sources: gemini` 或 `openalex` 显式触发;**默认 `all` 不含**(老用户零变化)。Maintainer fixup:修正 `@google/gemini-cli` npm 包名 + 加 `try/except ImportError` 让缺 `requests` 时 OpenAlex silent skip
- **2026-04-20** —  🩹 **项目级安装重构:扁平布局 + manifest 追踪** — 修一个真 bug:老的嵌套安装(`.claude/skills/aris/`)让 Claude Code 的 slash command 自动补全发现不了 skill(CC 只扫一层目录)。在此日期之前用过 `install_aris.sh` 的项目都中招但大多没意识到。新的 `install_aris.sh` 给每个 skill 单独创建 symlink 到 `.claude/skills/`,写版本化 manifest 到 `.aris/installed-skills.txt`,**可重入**——再跑一次会自动 reconcile 上游的新增/删除。防御性设计:13 条安全规则(不写穿 symlinked 父目录、mutate 前精确 revalidate target、slug 正则、同目录 atomic rename、绝不覆盖真实文件、mkdir 锁跨平台、ADOPT 状态用于崩溃恢复、…)。`--force` 拆成细粒度 `--adopt-existing` / `--replace-link`。迁移路径:`--from-old` 走老 symlink;`--migrate-copy keep-user|prefer-upstream` 走老 copy。`smart_update.sh --target-subdir .claude/skills/aris` 已弃用并重定向到 `install_aris.sh`。同时修了 `cp -r` 的 stale-file bug(现在用 `rm -rf && cp -r`,上游删的文件不再残留)
- **2026-04-19** —  🔗 **[`/overleaf-sync`](skills/overleaf-sync/SKILL.md)** — 本地 ARIS 论文目录与 Overleaf 项目的双向桥接,基于官方 **Overleaf Git Bridge**(Premium)。让合作者继续在 Overleaf 网页端编辑,本地同时跑 ARIS 审计/改写流水线(`/paper-claim-audit`、`/citation-audit`、`/auto-paper-improvement-loop`)。子命令:`setup`(一次性,由用户在终端完成,agent 全程不接触 token)/ `pull`(diff-protocol——自动识别半截草稿、typo、需要重新触发审计的数字/引用改动)/ `push`(写入共享 Overleaf 状态前必须用户确认)/ `status`(三方差异诊断)。**Token 永远不进入 agent 或任何文件**——只在用户终端里输入一次,存进 macOS Keychain,之后 agent 所有操作都免认证
- **2026-04-19** —  📚 **[`/citation-audit`](skills/citation-audit/SKILL.md)** — 证据-到-claim 审计栈的第四层也是最后一层(`experiment-audit` → `result-to-claim` → `paper-claim-audit` → `citation-audit`)。新鲜跨家族 reviewer(gpt-5.4 通过 Codex MCP)配合 web/DBLP/arXiv 实时查找,对每个 `\cite{...}` 沿三条独立轴进行验证:**存在性**(论文是否真在所声称的 arXiv ID/DOI/会议)、**元数据正确性**(作者/年份/会议/标题与权威源一致)、**上下文恰当性**(被引论文是否真正支持引用处的 claim——这是最具诊断价值的检查)。每条 entry 给出 KEEP / FIX / REPLACE / REMOVE 判决。已**自动集成到 Workflow 3 Phase 5.8** 作为投稿前的参考文献门控。实证动机:在一次真实投稿 run 中,多篇真实论文被引用在它们实际不支持的语境中,至少一条 entry 的 `author` 字段是 `"Anonymous"`——这些都是仅做元数据检查会漏掉的问题
- **2026-04-17** —  🔀 **`/experiment-queue` 集成到 Workflow 1.5 + research-pipeline** — `experiment-bridge` Phase 4 Deploy 阶段按 milestone 任务数自动路由:≤5 jobs → `/run-experiment`,≥10 jobs 或 phase 依赖 → `/experiment-queue`(自带 OOM 重试 / stale screen 清理 / wave 切换门控 / 崩溃安全状态)。新增 `--- batch: queue` 全局强制选项。`EXPERIMENT_PLAN.md` 里的大型多种子 sweep(如 36 格 `N × seed × n_train` grid)现在自动用队列调度,无需手动调用
- **2026-04-17** —  🔗 **[项目级 symlink 安装](tools/install_aris.sh)**(解决 [#118](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/118))— 新推荐默认安装方式。`bash tools/install_aris.sh` 自动检测平台(Claude Code / Codex CLI),创建 `.claude/skills/aris` 或 `.agents/skills/aris` symlink 指向 ARIS 仓库,在 `CLAUDE.md` / `AGENTS.md` 添加 `` 管理块告知 agent 仅用项目本地 skill,并在 `.aris/skill-source.txt` 记录安装元数据。**解决 skill 命名冲突问题**——当 ARIS 与 Superpowers / OpenHands 等社区 skill 包共用全局目录时,agent 会错误调用其他包的 skill 打断 ARIS 工作流。Windows 用户用 `install_aris.ps1`(基于 junction)。同时 `smart_update.sh` 新增 `--target-subdir` 参数支持 Codex `.agents/skills/aris` 项目级 copy 安装;symlink 安装会被拒绝并提示用 `git pull` 更新。全局安装继续支持给 power user
- **2026-04-16** —  🎨 **[`/figure-spec`](skills/figure-spec/SKILL.md)** — 确定性 JSON→SVG 渲染器正式包装为一级 skill。论文架构图/工作流/流水线/审计级联图的首选默认方案。形状感知边裁剪(矩形/圆/椭圆/菱形)、自环、弯曲边、多行标签含 CJK 宽度估算。矢量输出可编辑、可复现(相同 spec → 相同 SVG)、无外部 API。**Workflow 3 Phase 2b 恢复**:`illustration: figurespec`(新默认)/ `gemini` / `mermaid` / `false`——四档作图引擎互补并存
- **2026-04-16** —  ⚙️ **[`/experiment-queue`](skills/experiment-queue/SKILL.md)** — 面向多 seed 多配置 ML 实验的 SSH 任务队列。从真实 36 格 NeurIPS sweep 的痛点反推设计:OOM 感知重试(延迟退避)、stale screen 清理、wave 切换竞争防护、teacher→student 阶段依赖、崩溃安全的调度器(从 JSON 状态恢复)。声明式 grid 自动展开(如 `N × seed × n_train → 36 jobs`)。`conda_hook` + `gpu_free_threshold_mib` 可配置以适应非标准环境。≥10 jobs 时使用;`/run-experiment` 继续服务单点实验
- **2026-04-15** —  🛡️ **论文写作流水线加固** — 基于真实 NeurIPS run 失败分析的 10 个 patch。`REVIEWER_BIAS_GUARD=true`:每轮 review 用全新 thread(codex-reply 导致分数从真实 3/10 膨胀到虚假 8/10)。Reviewer Independence Protocol:禁止向 reviewer 传递修复摘要。Step 4.5 定理重述回归测试:捕捉修复轮次中的定理漂移。Step 5.5 Kill Argument Exercise:理论论文最终轮对抗攻防。位置感知 overfull 阻断。`/paper-write` 新增 Theory Paper Consistency Pass。Bib Hygiene 强制 DBLP/CrossRef 验证。Phase 5.5 Mandatory Final Claim Audit 作为投稿门控。**Review Tracing Protocol**:完整 prompt/response 对保存到 `.aris/traces/`,支持 reviewer-independence 审计([`review-tracing.md`](skills/shared-references/review-tracing.md),[`save_trace.sh`](tools/save_trace.sh))。灵感来自社区贡献 @李傲龍
- **2026-04-15** —  🎨 **[FigureSpec 渲染器 v2](tools/figure_renderer.py)** — 确定性 JSON→SVG 论文作图。形状感知边裁剪(矩形/圆/椭圆/菱形)、自环、弯曲边、多行标签含 CJK 宽度估算、综合输入验证。经 5 轮 Codex review(3/10→7/10)。ARIS 技术报告中的所有架构图和工作流图均由此生成。`/paper-illustration` 新增 `--- mode: vector` 模式
- **2026-04-14** —  📋 **[`/paper-claim-audit`](skills/paper-claim-audit/SKILL.md)** — 零上下文论文-证据验证。全新 reviewer(无任何先验上下文)逐一比对论文中的每个数字与原始结果文件。捕捉四舍五入膨胀、最优种子挑选、配置不匹配、增量误差、范围过度声明。自动集成到工作流 3(Phase 4.7)。完成三层审计链:`/experiment-audit`(代码)→ `/result-to-claim`(科学)→ `/paper-claim-audit`(报告)。👁️ **Visual PDF review** 同步加入 improvement loop——reviewer 现在看编译后 PDF,不只是 LaTeX 源码
- **2026-04-13** —  🧿 **[GPT-5.4 Pro via Oracle](skills/shared-references/reviewer-routing.md)** — `— reviewer: oracle-pro` 调用最强推理模型。API 模式(快)或浏览器模式(免费)。支持 `/research-review`、`/auto-review-loop`、`/experiment-audit`、`/proof-checker`、`/rebuttal`、`/idea-creator`、`/research-lit`。默认仍为 Codex xhigh。未安装 = 零影响。[设置 →](#-可选gpt-54-pro-via-oracle)
- **2026-04-13** —  🔬 **[`/proof-checker`](skills/proof-checker/SKILL.md)** — 严格数学证明验证。20 类问题分类、双轴严重度、侧条件检查表(DCT/MCT/Fubini/IFT/...)、反例红队、证明义务台账。自动集成到工作流 3。
- **2026-04-10** —  ⚡ **[Effort Levels](skills/shared-references/effort-contract.md)** — `— effort: lite | balanced | max | beast`。控制工作强度。Codex reasoning 永远 `xhigh`。`beast` = 全部拉满。默认 `balanced` = 零变化。
- **2026-04-10** —  🔎 **[DeepXiv 集成](skills/deepxiv/SKILL.md)** — 渐进式文献检索。`— sources: deepxiv`。`pip install deepxiv-sdk`。社区贡献 by [@DreamEnding](https://github.com/DreamEnding)
- **2026-04-10** —  🛡️ **[`/experiment-audit`](skills/experiment-audit/SKILL.md)** — 跨模型实验诚实度验证。GPT-5.4 直接读你的评估脚本和结果,检查伪造 GT、分数归一化作弊、幽灵结果、范围夸大([#131](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/131), [#57](https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep/issues/57))。仅警告不阻断。`/result-to-claim` 自动读取审计结果。新增 [experiment-integrity.md](skills/shared-references/experiment-integrity.md) 共享规则。**执行者不得审判自己的诚实度。**
- **2026-04-10** —  🧠 **[`tools/smart_update.sh`](tools/smart_update.sh)** — 智能技能更新器。对比本地 vs 上游,检测个人定制(服务器路径、API key 等),只更新安全的 skill。`bash tools/smart_update.sh --apply`
- **2026-04-10** —  🏆 **社区论文:[UAV-CC](community_papers/UAV-CC.pdf)** — 首篇带完整 PDF 存档的社区论文。无人机变化描述基准,投稿 IEEE TGRS,作者 [@wxx827](https://github.com/wxx827)。配置:Claude Opus 4.6 + Codex 5.4 xhigh + Cursor。论文存档于 `community_papers/`
- **2026-04-08** —  📚 **[`/research-wiki`](skills/research-wiki/SKILL.md)** — 持久化研究知识库,灵感来自 [Karpathy 的 LLM Wiki](https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f)。跨研究全生命周期积累论文、想法、实验、claim 及其 typed 关系。Wiki hooks 集成到 `/research-lit`(论文入库)、`/idea-creator`(读 wiki + 写回 idea)、`/result-to-claim`(更新 claim 状态 + 触发重新构思)。失败的 idea 成为防重复记忆。**ARIS 现在能从错误中学习。**
- **2026-04-05** —  🧬 **[`/meta-optimize`](skills/meta-optimize/SKILL.md)** — ARIS 外循环 harness 优化。通过 [Claude Code hooks](templates/claude-hooks/meta_logging.json) 被动记录技能调用、工具执行、失败和参数覆盖。运行 `/meta-optimize` 分析使用数据,提出 SKILL.md 改进方案——经 reviewer 审核、用户批准。灵感来自 [Meta-Harness](https://arxiv.org/abs/2603.28052)(Lee et al., 2026)。**ARIS 现在可以优化自己。**
- **2026-04-04** —  🔧 **Codex Plugin 深度集成** — 实验失败(工作流 1.5)或 LaTeX 编译出错(工作流 3)时,自动调用 `/codex:rescue` 让 GPT 独立诊断 bug,再由 Claude 重试。两个 AI 一起 debug。`codex exec` 驱动 nightmare review,`/codex:rescue` 驱动 auto-debug,各司其职
- **2026-04-03** —  ☁️ **[Modal 无服务器 GPU](skills/serverless-modal/SKILL.md)** — 没有 GPU?CLAUDE.md 写 `gpu: modal`,一条命令跑实验,无需 SSH/Docker,跑完自动停止。**$30/月免费额度**,`pip install modal && modal setup` 即可体验 ARIS 全流程。社区贡献 by [@zeyuzhangzyz](https://github.com/zeyuzhangzyz)
- **2026-04-03** —  🎮 **审稿难度等级** — `medium`(默认,不变)、`hard`(reviewer memory + 辩论协议)、`nightmare`(GPT 通过 `codex exec` 直接读代码仓库,Claude 无法隐藏任何东西)。投顶会前用 `— difficulty: nightmare` 做极限压测
- **2026-03-27** — 📄 **IEEE 模板**(9 个 venue 族)+ 🔎 **Semantic Scholar**。By [@ypd666](https://github.com/ypd666)
- **2026-03-26** — 📄 **文档输入** — `RESEARCH_BRIEF.md` 自动检测
- **2026-03-24** — 📝 **[工作流 4:`/rebuttal`](skills/rebuttal/SKILL.md)** — 7 阶段,3 道安全门
- **2026-03-23** — 🔧 `/training-check`、`/result-to-claim`、`/ablation-planner` 集成。📦 `compact` 模式。By [@JingxuanKang](https://github.com/JingxuanKang) & [@couragec](https://github.com/couragec)
- **2026-03-22** — 📋 **[模板](templates/)** + 📄 **7 个会议模板** + 🛡️ **反幻觉修复** + 🔗 **`base repo`**
- **2026-03-22** — 🔍 **[Codex + Gemini 审稿](docs/CODEX_GEMINI_REVIEW_GUIDE_CN.md)** — Codex 执行,Gemini 审稿
- **2026-03-20** — 🚀 **[Antigravity 适配](docs/ANTIGRAVITY_ADAPTATION_CN.md)**。社区贡献 by [@PeppaPigw](https://github.com/PeppaPigw)
- **2026-03-20** — 🖥️ **[Trae 适配](docs/TRAE_ARIS_RUNBOOK_CN.md)**。社区贡献 by [@Prometheus-cotigo](https://github.com/Prometheus-cotigo)。🔢 **[`formula-derivation`](skills/formula-derivation/SKILL.md)**。社区贡献 by [@Falling-Flower](https://github.com/Falling-Flower)
- **2026-03-19** — 🖼️ **[`paper-poster`](skills/paper-poster/SKILL.md)**。社区贡献 by [@dengzhe-hou](https://github.com/dengzhe-hou)
- **2026-03-19** — 🔗 **工作流 1.5 升级** — GPT-5.4 代码审查 + W&B 修正
- **2026-03-18** — 🎤 `paper-slides` + 🔁 Codex+Claude bridge + 🖱️ Cursor 适配 + 🤖 Codex CLI skills + 📝 `grant-proposal` + 🎨 `paper-illustration` + 📊 CitationClaw
- **2026-03-17** — 🔧 Git 代码同步 + 🆓 ModelScope 指南 + 参数透传
更早的更新(2026-03-12 — 2026-03-16)
- **2026-03-16** — 🔬 **[`research-refine`](skills/research-refine/SKILL.md)** + [`experiment-plan`](skills/experiment-plan/SKILL.md) — 模糊 idea → 问题锚点明确的方案 + claim-driven 实验路线图。社区贡献 by [@zjYao36](https://github.com/zjYao36)
- **2026-03-16** — 🇨🇳 **[阿里百炼 Coding Plan 接入指南](docs/ALI_CODING_PLAN_GUIDE.md)** — 一个 API Key、4 款模型。社区贡献 by [@tianhao909](https://github.com/tianhao909)
- **2026-03-15** — 🔀 **自带模型!** [任意 OpenAI 兼容 API](#-替代模型组合) 均可作为审查器
- **2026-03-15** — 🐾 **[OpenClaw 适配指南](docs/OPENCLAW_ADAPTATION.md)** — 在 OpenClaw 中使用 ARIS 工作流
- **2026-03-15** — 📐 **[`proof-writer`](skills/proof-writer/SKILL.md)** + 📚 **反幻觉引用**(DBLP/CrossRef)
- **2026-03-14** — 📱 [飞书集成](docs/integrations/FEISHU_CN.md):三种模式(关闭/推送/交互)
- **2026-03-13** — 🛑 Human-in-the-loop:`AUTO_PROCEED` 检查点
- **2026-03-12** — 🔗 Zotero + Obsidian + arXiv/Scholar 多源文献检索
- **2026-03-12** — 🚀 三大工作流端到端贯通 + 📝 论文写作流水线(4/10 → 8.5/10)
## 🚀 快速开始
```bash
# 1. 安装 skills
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git
cp -r Auto-claude-code-research-in-sleep/skills/* ~/.claude/skills/
# 可选:Codex mirror 项目级受管安装
bash Auto-claude-code-research-in-sleep/tools/install_aris_codex.sh ~/your-codex-project
# Codex 受管项目更新
cd Auto-claude-code-research-in-sleep && git pull
bash Auto-claude-code-research-in-sleep/tools/install_aris_codex.sh ~/your-codex-project --reconcile
# 仅用于 Codex copy install(不要用于 install_aris_codex.sh 管理的项目)
bash Auto-claude-code-research-in-sleep/tools/smart_update_codex.sh --local ~/.codex/skills
bash Auto-claude-code-research-in-sleep/tools/smart_update_codex.sh --local ~/.codex/skills --apply
# 2. 配置 Codex MCP(review 类 skill 需要)
npm install -g @openai/codex
codex setup # 提示选模型时选 gpt-5.5
claude mcp add codex -s user -- codex mcp-server
# 3. 在 Claude Code 中使用
claude
> /idea-discovery "你的研究方向" # 工作流 1 — 方向要具体!不要 "NLP",要 "离散扩散语言模型的 factorized gap"
> /experiment-bridge # 工作流 1.5 — 有计划了?实现 + 部署 + 收结果
> /auto-review-loop "你的论文主题或范围" # 工作流 2:审稿 → 修复 → 再审,一夜完成
> /paper-writing "NARRATIVE_REPORT.md" # 工作流 3:研究叙事 → 精修 PDF
> /rebuttal "paper/ + reviews" — venue: ICML # 工作流 4:解析 review → 起草 rebuttal → follow-up
> /resubmit-pipeline "paper/" — venue: NeurIPS # 工作流 5:把已打磨论文移植到新 venue(纯文本,不跑新实验)
> /paper-talk "paper/" — venue: ICLR # 工作流 6:论文 → Beamer + PPTX talk slides + 讲稿 + 评审审计
> /research-pipeline "你的研究方向" # 全流程:工作流 1 → 1.5 → 2 → 3 端到端
> /research-wiki init # 📚 启用持久化研究记忆(一次性)
> /meta-optimize # 元优化:分析使用记录 → 提出技能改进方案
```
📚 Research Wiki(可选) —— 一行 init 启用跨 session 持久记忆;完整说明见 § Research Wiki
给 ARIS 装上持久记忆。论文、idea、失败实验——什么都不忘:
```bash
# 在 Claude Code 中:
> /research-wiki init # 创建 research-wiki/ 目录
# 搞定。此后 /research-lit 自动入库论文,/idea-creator 读 wiki 再想 idea
# (并把 idea 写回),/result-to-claim 更新 claim 状态。
# 失败的 idea 成为未来构思的防重复记忆。
```
🧬 元优化(可选) —— 被动使用日志 + /meta-optimize 出数据驱动的 SKILL.md 改进建议;完整说明见 § 工作流 M
在**普通终端**(不是 Claude Code 会话内)运行以下命令启用被动日志:
```bash
# 在项目目录下一次性设置
mkdir -p .claude .aris/meta tools/meta_opt
cp Auto-claude-code-research-in-sleep/templates/claude-hooks/meta_logging.json .claude/settings.json
cp Auto-claude-code-research-in-sleep/tools/meta_opt/*.sh tools/meta_opt/
chmod +x tools/meta_opt/*.sh
# 然后启动 Claude Code — hooks 立即生效
claude
```
事件同时记录到**项目级**(`.aris/meta/events.jsonl`)和**全局**(`~/.aris/meta/events.jsonl`)日志。累积 5 次以上工作流运行后,运行 `/meta-optimize` 查看改进建议。使用 `/meta-optimize --global` 分析跨项目的使用趋势。
📝 模板 + 🔎 DeepXiv + 🔎 Exa + 🗑️ 卸载 —— 输入模板、两个额外文献源、以及卸载命令
**📝 模板可用!** 见 [`templates/`](templates/) 目录——每个工作流都有现成输入模板:[研究简报](templates/RESEARCH_BRIEF_TEMPLATE.md)(工作流 1)、[实验计划](templates/EXPERIMENT_PLAN_TEMPLATE.md)(工作流 1.5)、[研究叙事](templates/NARRATIVE_REPORT_TEMPLATE.md)(工作流 3)、[论文大纲](templates/PAPER_PLAN_TEMPLATE.md)(工作流 3)。
**🔎 可选:DeepXiv 渐进式论文检索**
```bash
pip install deepxiv-sdk
```
安装后可直接使用 [`/deepxiv`](skills/deepxiv/SKILL.md),或在 `/research-lit` 中通过 `— sources: deepxiv` / `— sources: all, deepxiv` 显式启用。
**🔎 可选:Exa AI 智能网页搜索**
```bash
pip install exa-py
export EXA_API_KEY=your-key-here
```
安装后可直接使用 [`/exa-search`](skills/exa-search/SKILL.md),或在 `/research-lit` 中通过 `— sources: exa` / `— sources: all, exa` 显式启用。覆盖博客、文档、新闻和研究论文,并内置内容提取。
**🗑️ 卸载:** 仅删除 ARIS skills,不影响你自己的 skills:
```bash
cd Auto-claude-code-research-in-sleep && ls skills/ | xargs -I{} rm -rf ~/.claude/skills/{}
```
展开全部 15 个内联参数和 8 个 override 示例 —— AUTO_PROCEED / sources / arxiv download / DBLP_BIBTEX / code review / wandb / illustration / venue / base repo / compact / ref paper / effort / reviewer / difficulty(完整 per-skill 默认值见 § 自定义)
所有流水线行为均可通过内联参数配置——在命令后追加 `— key: value`:
| 参数 | 默认 | 说明 |
|------|------|------|
| `AUTO_PROCEED` | `true` | 在 idea 选择关卡自动继续。设为 `false` 可在花 GPU 前手动挑选 idea |
| `human checkpoint` | `false` | 每轮 review 后暂停,让你查看分数、给出修改意见、跳过特定修复或提前终止 |
| `sources` | `all` | 搜索哪些文献源:`zotero`、`obsidian`、`local`、`web`、`semantic-scholar`、`deepxiv`、`exa`、`all`。`semantic-scholar`、`deepxiv` 和 `exa` 都需显式指定 |
| `arxiv download` | `false` | 文献调研时下载最相关的 arXiv PDF。为 `false` 时仅获取元数据(标题、摘要、作者) |
| `DBLP_BIBTEX` | `true` | 从 [DBLP](https://dblp.org)/[CrossRef](https://www.crossref.org) 获取真实 BibTeX,替代 LLM 生成。杜绝幻觉引用。零安装 |
| `code review` | `true` | GPT-5.4 xhigh 部署前审查实验代码。设 `false` 跳过 |
| `wandb` | `false` | 自动给实验脚本加 W&B 日志。设 `true` + 在 CLAUDE.md 配 `wandb_project`。`/monitor-experiment` 从 W&B 拉训练曲线 |
| `illustration` | `gemini` | 工作流 3 AI 作图:`gemini`(默认,需 `GEMINI_API_KEY`,[获取](https://aistudio.google.com/apikey))、`mermaid`(免费)、`false`(跳过) |
| `venue` | `ICLR` | 目标会议:`ICLR`、`NeurIPS`、`ICML`、`CVPR`、`ACL`、`AAAI`、`ACM`、`IEEE_JOURNAL`、`IEEE_CONF`。决定 LaTeX 样式和页数限制 |
| `base repo` | `false` | GitHub 仓库 URL,克隆作为实验基础代码(如 `— base repo: https://github.com/org/project`)。没有代码?基于开源项目开发 |
| `compact` | `false` | 生成精简摘要文件(`IDEA_CANDIDATES.md`、`findings.md`、`EXPERIMENT_LOG.md`),适合短 context 模型和 session 恢复 |
| `ref paper` | `false` | 参考论文(PDF 路径或 arXiv URL)。先总结论文,再基于它找 idea。配合 `base repo` 实现"论文+代码"工作流 |
| `effort` | `balanced` | 工作强度:`lite`(0.4x)、`balanced`(默认)、`max`(2.5x)、`beast`(5-8x)。Codex reasoning 永远 `xhigh` |
| `reviewer` | `codex` | 审稿后端:`codex`(GPT-5.4 xhigh,默认)、`oracle-pro`(GPT-5.4 Pro via [Oracle](https://github.com/steipete/oracle)) |
| `difficulty` | `medium` | 审稿对抗强度:`medium`(默认)、`hard`(+ memory + 辩论)、`nightmare`(+ GPT 通过 `codex exec` 直读仓库) |
```
/research-pipeline "你的课题" — AUTO_PROCEED: false # 在 idea 选择关卡暂停
/research-pipeline "你的课题" — human checkpoint: true # 每轮 review 后暂停,可给修改意见
/research-pipeline "你的课题" — sources: zotero, web # 只搜 Zotero + 网络(跳过本地 PDF)
/research-pipeline "你的课题" — sources: all, deepxiv # 默认源 + DeepXiv 渐进式检索
/research-pipeline "你的课题" — sources: all, exa # 默认源 + Exa AI 智能网页搜索
/research-pipeline "你的课题" — arxiv download: true # 文献调研时下载最相关的 arXiv PDF
/research-pipeline "你的课题" — difficulty: nightmare # 投顶会前极限压测
/research-pipeline "你的课题" — AUTO_PROCEED: false, human checkpoint: true # 组合使用
```
Codex MCP 配置 + 替代 reviewer 路由 —— 在 ~/.codex/config.toml 钉模型;Codex+Claude 审稿、Codex+Gemini 审稿、Codex mirror 安装链的入口指向
**重要:** Codex MCP 使用的模型取决于 `~/.codex/config.toml`,而非 skill 文件中的设置。请确认其中写的是 `model = "gpt-5.5"`(推荐)。其他可用模型:`gpt-5.3-codex`、`gpt-5.2-codex`、`o3`。运行 `codex setup` 或直接编辑该文件。
**想让 Codex 执行、Claude Code 审稿?** 见 [`docs/CODEX_CLAUDE_REVIEW_GUIDE_CN.md`](docs/CODEX_CLAUDE_REVIEW_GUIDE_CN.md)。这条路径会先安装基础 `skills/skills-codex/*`,再叠加 `skills/skills-codex-claude-review/*`,并通过本地 `claude-review` MCP bridge 转发 review-heavy skill 的审稿请求。
**想让 Codex 执行、Gemini 在本地做审稿?** 见 [`docs/CODEX_GEMINI_REVIEW_GUIDE_CN.md`](docs/CODEX_GEMINI_REVIEW_GUIDE_CN.md) 和[英文版](docs/CODEX_GEMINI_REVIEW_GUIDE.md)。这条路径会先安装基础 `skills/skills-codex/*`,再叠加 `skills/skills-codex-gemini-review/*`,并通过本地 `gemini-review` MCP bridge 转发 reviewer-aware 预定义 skills 的审稿请求,默认 direct Gemini API。
**想走 Codex mirror 安装链?** 项目级受管安装用 `tools/install_aris_codex.sh`,copy 安装更新用 `tools/smart_update_codex.sh`。Claude 脚本仍然是 Claude 主线入口。
详见[完整安装指南](#%EF%B8%8F-安装)和[替代模型组合](#-替代模型组合)(无需 Claude/OpenAI API)。
## ✨ 功能亮点
- 📊 **74 个可组合 skill** — 自由混搭,或串联为完整流水线(`/idea-discovery`、`/auto-review-loop`、`/paper-writing`、`/research-pipeline`)。[完整目录 →](docs/SKILLS_CATALOG.md)
- 🔍 **文献 & 查新** — 多源论文搜索(**[Zotero](docs/integrations/ZOTERO_CN.md)** + **[Obsidian](docs/integrations/OBSIDIAN_CN.md)** + **本地 PDF** + arXiv/Scholar)+ 跨模型查新验证
- 💡 **Idea 发现** — 文献调研 → 头脑风暴 8-12 个 idea → 查新 → GPU pilot 实验 → 排名报告
- 🔄 **自动 review 循环** — 4 轮自主审稿,一夜从 5/10 提升到 7.5/10,自动跑 20+ 组 GPU 实验
- 📝 **论文写作** — 研究叙事 → 大纲 → 图表 → LaTeX → PDF → 自动审稿(4/10 → 8.5/10),一条命令。通过 [DBLP](https://dblp.org)/[CrossRef](https://www.crossref.org) 反幻觉引用
- 🤖 **跨模型协作** — Claude Code 执行,GPT-5.4 xhigh 审稿。对抗式而非自我博弈。可选:`— reviewer: oracle-pro` → **GPT-5.4 Pro** via [Oracle](https://github.com/steipete/oracle)
- 📝 **Peer Review** — 以审稿人视角审阅他人论文,结构化打分 + meta-review
- 🖥️ **审稿驱动实验** — GPT-5.4 说"跑个消融",Claude 自动写脚本、rsync 到 GPU、`screen` 启动、收结果、写回论文。`CLAUDE.md` 里配服务器([配置](#%EF%B8%8F-gpu-服务器配置自动实验用)),或用 `gpu: vast` 从 [Vast.ai](https://vast.ai) 按需租
- 🔀 **灵活模型** — 默认 Claude × GPT-5.4,也支持 [GLM、MiniMax、Kimi、LongCat、DeepSeek 等](#-替代模型组合)——无需 Claude 或 OpenAI API
- 🛑 **Human-in-the-loop** — 关键决策点可配置检查点。`AUTO_PROCEED=true` 全自动,`false` 逐步审批
- 📱 **[飞书通知](docs/integrations/FEISHU_CN.md)** — 三种模式:**关闭(默认,推荐)**、仅推送(webhook → 手机)、双向交互(飞书里审批/回复)。未配置时零影响
预览:推送卡片(群聊)& 交互对话(私聊)
**仅推送** — 群聊彩色卡片(实验完成、checkpoint、报错、流水线结束):
**双向交互** — 与 Claude Code 私聊(审批/拒绝、自定义指令):
- 📚 **[Research Wiki](#-research-wiki--持久化研究记忆)** — 持久化知识库,跨论文/idea/实验/claim 累积记忆。失败的 idea 成为防重复记忆——ARIS 每跑一次都更聪明。灵感来自 [Karpathy 的 LLM Wiki](https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f)
- 🧩 **可扩展** — 欢迎贡献领域专用 skill!添加一个 `SKILL.md` 即可提 PR。参见[社区 skills](#-全部-skills),如 [`dse-loop`](skills/dse-loop/SKILL.md)(体系结构/EDA)
---
## 📈 真实运行效果
某 ML 研究项目上的 4 轮自动循环,从 borderline reject 到可投稿:
| 轮次 | 分数 | 发生了什么 |
|------|------|-----------|
| 初始 | 5.0/10 | Borderline reject |
| 第 1 轮 | 6.5/10 | 补了标准指标,发现指标脱钩 |
| 第 2 轮 | 6.8/10 | 核心声明不可复现,转换叙事 |
| 第 3 轮 | 7.0/10 | 大规模 seed 研究推翻了主要改善声明 |
| 第 4 轮 | **7.5/10** ✅ | 诊断证据确立,**可以投稿** |
循环自主跑了 **20+ 个 GPU 实验**,重写了论文叙事框架,杀掉了经不住检验的声明——全程无人干预。
## 🏆 社区实操 — 用 ARIS 完成的论文
ARIS 全流程完成并进入投稿/审稿阶段的真实项目。**这里不宣称官方中稿,除非某一行明确写明已接收**:表中的分数和评价来自 [CSPaper](https://cspaper.org/)、[Stanford Agentic Reviewer](https://paperreview.ai/) 等 AI/第三方审稿模拟系统,不等同于会议或期刊的正式审稿意见。一个重要 caveat:ARIS 的核心机制就是让论文在 AI reviewer 反馈下反复迭代,所以 AI 审稿分数偏高是工作流的正常结果,而不是独立的录用证据;真实人类审稿者仍可能带来更新的文献视角、社区判断、venue taste 和 AI 系统没有建模到的问题。**如果你也用 ARIS 完成了论文,欢迎提 Issue 或 PR 告诉我们!**
| 论文 | AI 审稿信号 | 投稿状态 | 作者 | 备注 |
|------|:------------:|----------|------|------|
| **CS 论文投稿** | [CSPaper](https://cspaper.org/) **8/10** — AI 审稿建议:"Top 50% of accepted papers, clear accept" | 已投 CS 会议,等待正式审稿反馈 | [@DefanXue](https://github.com/DefanXue) & [@Monglitay](https://github.com/Monglitay) | ARIS 全流程:idea → 实验 → auto-review → 论文写作。该评价来自 CSPaper 模拟审稿,不是会议官方审稿意见。 |
| **AAAI 2026 论文投稿** | [Stanford Agentic Reviewer](https://paperreview.ai/) **7/10** — AI 审稿建议:"Good paper, accept" | 已投 AAAI 2026 Main Technical,等待官方结果 | [@xinbo820-web](https://github.com/xinbo820-web) | 纯 **Codex CLI**(ARIS-Codex skills)。7/10 来自 Stanford Agentic Reviewer 的 AAAI-style 模拟审稿,不代表 AAAI 官方审稿/录用结果。 |
| [UAV-CC](community_papers/UAV-CC.pdf) | 审稿中 | 已投 IEEE TGRS | [@wxx827](https://github.com/wxx827) | 无人机变化描述基准。Claude Opus 4.6(执行)+ Codex GPT-5.4 xhigh(审阅)+ Cursor Opus 4.6(辅助)。[PDF →](community_papers/UAV-CC.pdf) |
审稿截图
> *ARIS 全流程完成的投稿案例——从 idea 到 submission。还有更多?告诉我们!*
## 🧩 Awesome 社区 Skills & 扩展
社区贡献的领域专用 skills 和外部项目。欢迎 PR——添加 `skills/your-skill/SKILL.md` 即可!
> 💡 **使用方法:** 社区 skill 不会自动接入核心工作流。使用时,让你的执行者(Claude Code / OpenClaw 等)先读一遍该 skill 的 `SKILL.md`,再根据下方描述接入对应的工作流阶段。
🎉 **社区 Skills(11 个):** [research-refine](skills/research-refine/SKILL.md) · [experiment-plan](skills/experiment-plan/SKILL.md) · [grant-proposal](skills/grant-proposal/SKILL.md) · [paper-poster](skills/paper-poster/SKILL.md) · [paper-slides](skills/paper-slides/SKILL.md) · [mermaid-diagram](skills/mermaid-diagram/SKILL.md) · [proof-writer](skills/proof-writer/SKILL.md) · [comm-lit-review](skills/comm-lit-review/SKILL.md) · [dse-loop](skills/dse-loop/SKILL.md) · [idea-discovery-robot](skills/idea-discovery-robot/SKILL.md) · [paper-illustration](skills/paper-illustration/SKILL.md)
🌐 **外部项目 & 文档(10 个):** [rosetta](https://github.com/SyntaxSmith/rosetta) · [open-source-hardening-skills](https://github.com/zeyuzhangzyz/open-source-hardening-skills) · [CitationClaw](https://github.com/VisionXLab/CitationClaw) · [paper-to-course](https://github.com/KaguraTart/paper-to-course) · [deep-research-skills](https://github.com/Weizhena/deep-research-skills) · [Antigravity 适配指南](docs/ANTIGRAVITY_ADAPTATION_CN.md) · [OpenClaw 适配指南](docs/OPENCLAW_ADAPTATION.md) · [Cursor 适配指南](docs/CURSOR_ADAPTATION.md) · [Trae 适配指南](docs/TRAE_ARIS_RUNBOOK_CN.md) · [paper-illustration](skills/paper-illustration/SKILL.md)
> 🙌 感谢每一位贡献者!为了 README 的可读性,下方表格折叠展示——但每个 skill 和项目都同样珍贵。欢迎 PR!
🎉 社区 Skills(11 个) — 点击展开
| 名称 | 领域 | 描述 | Codex MCP? |
|------|------|------|-----------|
| 🔬 [`research-refine`](skills/research-refine/SKILL.md) | 通用 | 把模糊 idea 精炼成问题锚点明确、可实现的方法方案 | 是 |
| 🧪 [`experiment-plan`](skills/experiment-plan/SKILL.md) | 通用 | claim-driven 实验路线图,含 ablation、预算和执行顺序 | 否 |
| 🧭 [`research-refine-pipeline`](skills/research-refine-pipeline/SKILL.md) | 通用 | 一条龙:`/research-refine` → `/experiment-plan` | 是 |
| 📝 [`grant-proposal`](skills/grant-proposal/SKILL.md) | 通用 | 基金申请书(科研費/NSF/国自然/ERC/DFG/SNSF/ARC/NWO) | 是 |
| 🎤 [`paper-slides`](skills/paper-slides/SKILL.md) | 通用 | 会议演讲幻灯片(beamer → PDF + PPTX),含完整演讲稿、speaker notes、Q&A 预案 | 是 |
| 📐 [`proof-writer`](skills/proof-writer/SKILL.md) | ML 理论 | 严格定理/引理证明撰写——可行性分类、依赖图谱 | 否 |
| 📡 [`comm-lit-review`](skills/comm-lit-review/SKILL.md) | 通信 / 无线 | 通信领域文献检索——IEEE/ACM 优先、venue 分层、PHY/MAC/NTN 分类 | 否 |
| 🏗️ [`dse-loop`](skills/dse-loop/SKILL.md) | 体系结构 / EDA | 自动设计空间探索——迭代调参(gem5、Yosys 等) | 否 |
| 🤖 [`idea-discovery-robot`](skills/idea-discovery-robot/SKILL.md) | 机器人 / 具身智能 | 工作流 1 适配版——按 embodiment、sim2real、安全约束筛选 idea | 是 |
| 🖼️ [`paper-poster`](skills/paper-poster/SKILL.md) | 通用 | 会议海报(article + tcbposter → A0/A1 PDF + 组件化 PPTX + SVG),会议配色、视觉审稿循环、Codex MCP 评审 | 是 |
| 📐 [`mermaid-diagram`](skills/mermaid-diagram/SKILL.md) | 通用 | Mermaid 图表(20+ 种类型)——`paper-illustration` 的免费替代,无需 API key | 否 |
🌐 外部项目 & 文档(10 个) — 点击展开
| 名称 | 领域 | 描述 |
|------|------|------|
| 🪨 [rosetta](https://github.com/SyntaxSmith/rosetta) | Pro 级 ChatGPT MCP | Node 程序化访问 **ChatGPT Pro / `gpt-5.5-pro` / DeepResearch**——通过 Chrome CDP Fetch 拦截 + WebSocket second-leg streaming 实现。自带 MCP server(Claude Code / Codex / Cline),是 Oracle MCP 在 `— reviewer: oracle-pro` 高 tier review 上的另一种实现路径。支持多轮对话、并发、live token deltas、15 分钟 idle-timeout watchdog(长 Pro thinking 不会被误杀)。MIT,by [@SyntaxSmith](https://github.com/SyntaxSmith) |
| 🛡️ [open-source-hardening-skills](https://github.com/zeyuzhangzyz/open-source-hardening-skills) | DevOps / 开源 | 10 个 skill 流水线,将研究代码加固为生产级开源项目 |
| 📊 [CitationClaw](https://github.com/VisionXLab/CitationClaw) | 通用 | 引用影响力分析——论文标题 → 引用爬取、学者识别、HTML 报告 |
| 🚀 [Antigravity 适配指南](docs/ANTIGRAVITY_ADAPTATION_CN.md) | 通用 | 在 [Google Antigravity](https://antigravity.google/) 中使用 ARIS skills——原生 SKILL.md 支持,双模型(Claude Opus 4.6 / Gemini 3.1 Pro),MCP 配置,中[英](docs/ANTIGRAVITY_ADAPTATION.md)文指南 |
| 🐾 [OpenClaw 适配指南](docs/OPENCLAW_ADAPTATION.md) | 通用 | 在 [OpenClaw](https://github.com/All-Hands-AI/OpenHands) 中使用 ARIS 工作流 |
| 🖱️ [Cursor 适配指南](docs/CURSOR_ADAPTATION.md) | 通用 | 在 [Cursor](https://www.cursor.com/) 中使用 ARIS skills |
| 🖥️ [Trae 适配指南](docs/TRAE_ARIS_RUNBOOK_CN.md) | 通用 | 在 [Trae](https://www.trae.ai/)(字节跳动 AI IDE)中使用 ARIS skills |
| 🎨 [`paper-illustration`](skills/paper-illustration/SKILL.md) | 通用 | AI 生成架构图(Gemini)。基于 [PaperBanana](https://github.com/dwzhu-pku/PaperBanana),集成到工作流 3 |
| 🤖 [`skills-codex`](skills/skills-codex/) | 通用 | 主线科研技能的 Codex CLI 同步包,已补入 `training-check`、`result-to-claim`、`ablation-planner`、`rebuttal`,并附带 `shared-references/` 支持目录 |
| 🎛️ [auto-hparam-tuning](https://github.com/zxh0916/auto-hparam-tuning) | 通用 | 自动超参调优——AI agent 读项目、规划策略、跑实验、分析 TensorBoard、从结果中学习。基于 Hydra |
| 📚 [paper-to-course](https://github.com/KaguraTart/paper-to-course) | 教育 | 论文转交互式课程——PDF/LaTeX 论文自动转为六模块 HTML 课程,含公式拆解、文献时间线、测验、术语提示。单文件打包,无需服务器 |
| 🔎 [deep-research-skills](https://github.com/Weizhena/deep-research-skills) | 通用 / Web 搜索 | 模块化 web 搜索策略包——按源拆分独立模块:Stack Overflow / GitHub Issues 错误串调试 / 中文技术社区(CSDN / 掘金 / 知乎 / V2EX / 腾讯阿里云社区)/ 通用 Web(Reddit / HN / Dev.to / Medium)。补 ARIS [`/research-lit`](skills/research-lit/SKILL.md) 以学术源为主的栈,给**非学术**场景(调试、版本兼容追踪、中文技术检索)提供查询策略。by [@Weizhena](https://github.com/Weizhena) |
## 🔄 工作流
所有 Skills 组成完整科研流水线。四个工作流可以单独使用,也可以串联:
- **探索新方向(比如写 survey)?** 从工作流 1 开始 → `/idea-discovery`
- **有计划了,需要实现和跑实验?** 工作流 1.5 → `/experiment-bridge`
- **已有结果,需要迭代改进?** 工作流 2 → `/auto-review-loop`
- **准备写论文了?** 工作流 3 → `/paper-writing`(或分步:`/paper-plan` → `/paper-figure` → `/paper-write` → `/paper-compile` → `/auto-paper-improvement-loop`)
- **全流程?** 工作流 1 → 1.5 → 2 → 3 → `/research-pipeline`,从文献调研一路到投稿
- **想让 ARIS 记住并学习?** 📚 `/research-wiki init` — 跨会话持久记忆,论文、idea、失败实验复合积累
- **想让 ARIS 优化自己?** 工作流 M → `/meta-optimize` — 分析使用日志,提出技能改进,reviewer 审核
> ⚠️ **重要提醒:** 这些工具加速科研,但不能替代你自己的思考。生成的 idea 一定要用你的领域知识审视,质疑其假设,最终决策权在你手上。最好的研究 = 人的洞察 + AI 的执行力,而不是全自动流水线。
### 完整流程 🚀
```
/research-lit → /idea-creator → /novelty-check → /research-refine → /experiment-bridge → /auto-review-loop → /paper-plan → /paper-figure → /paper-write → /auto-paper-improvement-loop → 投稿
(调研文献) (找idea) (查新验证) (打磨方案) (实现+部署) (自动改到能投) (大纲) (作图) (LaTeX+PDF) (审稿×2 + 格式检查) (搞定!)
├────────────── 工作流 1:找 Idea + 方案精炼 ──────────────┤ ├─ 工作流 1.5 ─┤ ├── 工作流 2 ──┤ ├───────────────── 工作流 3:论文写作 ─────────────────────┤
```
📝 **博客:** [梦中科研全流程开源](http://xhslink.com/o/2iV33fYoc7Q)
### 工作流 1:Idea 发现与方案精炼 🔍
> "这个领域最新进展是什么?哪里有 gap?怎么解决?"
还没有具体 idea?给一个研究方向就行——`/idea-discovery` 搞定剩下的:
1. 📚 **调研**全景(最新论文、开放问题、反复出现的局限性)
2. 🧠 **头脑风暴** 8-12 个具体 idea(GPT-5.4 xhigh)
3. 🔍 **初筛**可行性、算力成本、快速查新
4. 🛡️ **深度验证** top idea(完整查新 + devil's advocate review)
5. 🧪 **并行 pilot 实验**(top 2-3 个 idea 分别上不同 GPU,30 分钟 - 2 小时)
6. 🏆 **按实验信号排序**——有正信号的 idea 排前面
7. 🔬 **精炼方案**——冻结问题锚点,通过 GPT-5.4 迭代 review 打磨方法
8. 🧪 **规划实验**——claim-driven 实验路线图,含 ablation、预算和执行顺序
输出 `IDEA_REPORT.md`(排名后的 idea)+ `refine-logs/FINAL_PROPOSAL.md`(精炼后的方案)+ `refine-logs/EXPERIMENT_PLAN.md`(实验路线图)。失败的 idea 也记录在案,避免重复踩坑。
**涉及 Skills:** `research-lit` + `idea-creator` + `novelty-check` + `research-review` + `research-refine-pipeline`
> 💡 **一键调用:** `/idea-discovery "你的研究方向"` 自动跑完整个工作流 1。
> 🔄 **人在回路中:** 每个阶段都会展示结果等你反馈。不满意?告诉它哪里不对——调整 prompt 重新生成。信任默认选择?它会自动带着最优方案继续。你决定参与多深。
> ⚙️ Pilot 实验预算(最大时长、超时、GPU 总预算)均可配置——见[自定义](#%EF%B8%8F-自定义)。
展开工作流 1 的命令清单示例 —— research-lit → idea-creator → novelty-check → research-refine → experiment-plan 一步步该敲什么
```
1. /research-lit "discrete diffusion models" ← Zotero→Obsidian→本地→网络,整理全景
/research-lit "topic" — sources: zotero, web ← 或指定只搜部分源
/research-lit "topic" — arxiv download: true ← 同时下载最相关的 arXiv PDF
2. /idea-creator "DLLMs post training" ← 自动生成 8-12 个 idea,筛选排序
3. 选 top 2-3 个 idea
4. /novelty-check "top idea" ← 查新:有没有人做过?
5. /research-review "top idea" ← 让外部 LLM 批判你的想法
6. /research-refine "top idea" ← 冻结问题锚点 + 精炼方法
7. /experiment-plan ← claim-driven 实验路线图
8. /run-experiment → /auto-review-loop ← 闭环!
```
📝 **博客:** [Claude Code 两月 NeurIPS 指北](http://xhslink.com/o/7IvAJQ41IBA)
### 工作流 1.5:实验桥接 🔗
> "我有计划了,帮我实现代码、部署实验、拿到初始结果。"
已有实验计划(来自工作流 1 或自己写的)?`/experiment-bridge` 一键搞定:
1. 📋 **解析**实验计划(`refine-logs/EXPERIMENT_PLAN.md`)
2. 💻 **实现**实验脚本(复用已有代码,加 argparse/logging/seed)
3. 🔍 **GPT-5.4 代码审查** — 跨模型 review 在浪费 GPU 前抓逻辑 bug(`code review: true` 默认开启)
4. ✅ **Sanity check** — 先跑最小实验,发现运行时 bug
5. 🚀 **部署**完整实验到 GPU(`/run-experiment`)
6. 📊 **收集**初始结果,更新实验 tracker
展开工作流 1.5 流程图 —— 实验计划 → Claude 实现 → GPT-5.4 审码 → sanity check → GPU 部署 → 监控 → 结果
```
┌─────────────────────────────────────────────────────────────────┐
│ 工作流 1.5:实验桥接 │
│ │
│ EXPERIMENT_PLAN.md │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ Claude │────▶│ GPT-5.4 │────▶│ Sanity │ │
│ │ Code │ │ xhigh │ │ Check │ │
│ │ 写代码 │ │ 审查代码 │ │ (1 GPU) │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 收集 │◀────│ 监控进度 │◀────│ 部署到 │ │
│ │ 结果 │ │ (+ W&B) │ │ GPU │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │
│ ▼ │
│ 准备好进入 /auto-review-loop │
└─────────────────────────────────────────────────────────────────┘
```
**涉及 Skills:** `experiment-bridge` + `run-experiment` + `monitor-experiment`
> 💡 **一键调用:** `/experiment-bridge` 自动读取 `refine-logs/EXPERIMENT_PLAN.md`。也可指定:`/experiment-bridge "my_plan.md"`。
> ⚙️ `CODE_REVIEW`、`AUTO_DEPLOY`、`SANITY_FIRST`、`MAX_PARALLEL_RUNS` 均可配置——见[自定义](#%EF%B8%8F-自定义)。
### 工作流 2:自动科研循环 🔁(睡一觉醒来看结果)
> "帮我 review 论文,修复问题,循环到通过为止。"
>
> GPT-5.4 审稿 → 定位弱点 → 建议实验 → Claude Code 自动写脚本、部署到 GPU、监控结果、改写论文——你睡觉就行。只需在 `CLAUDE.md` 里配好[GPU 服务器信息](#%EF%B8%8F-gpu-服务器配置自动实验用)。
1. 🔍 **深度评审** — GPT-5.4 xhigh 对当前论文 / claims / 实验做一遍深读,定位弱点
2. 🩹 **修复** — Claude 实现修复(改写章节、加 baseline、或通过 `/run-experiment` 跑新实验);预估超过 4 GPU-小时的实验直接跳过、标记为"需人工跟进"
3. 📊 **再评估** — `/monitor-experiment` 收结果、改稿、再喂回 reviewer
4. 🔁 **循环** — 直到分数 ≥ `POSITIVE_THRESHOLD`(默认 6/10)或撞到 `MAX_ROUNDS`(默认 4);中途上下文窗口满了,工作流会从 `REVIEW_STATE.json` 自动恢复
展开工作流 2 的小流程图 —— 外部评审 → 实现修复 / 跑实验 → 监控结果 → 循环到阈值
```
外部 LLM 评审 → Claude Code 实现修复 → /run-experiment 部署 → 收结果 → 再评审 → 循环
↑ 需要新方向时自动 /novelty-check 查新
```
**涉及 Skills:** `auto-review-loop` + `research-review` + `novelty-check` + `run-experiment` + `analyze-results` + `monitor-experiment`
> 💡 **一键调用:** `/auto-review-loop "你的论文主题"` 自动跑完整个工作流 2。
展开工作流 2 的参数示例、reviewer 难度等级和完整安全机制 —— topic/scope 怎么传、medium/hard/nightmare 区别、6 条安全规则
**传什么参数?** 简短的主题或范围就够——skill 会自动读取项目中的叙事文档(`NARRATIVE_REPORT.md`)、memory 文件、实验结果和历史 review,为 GPT-5.4 组装完整上下文。示例:
- `/auto-review-loop "离散扩散语言模型的 factorized gap"` — 宽泛主题,skill 自动搜集
- `/auto-review-loop "重点看第 3-5 节,CRF 结果偏弱"` — 指定范围 + 提示
- `/auto-review-loop` — 也行:skill 读项目文件自动推断主题
用法:
```
> /auto-review-loop 我的 diffusion model 论文
```
**🎮 审稿难度** — 控制 reviewer 的对抗强度:
| 难度 | 变化 | 适用场景 |
|------|------|---------|
| `medium`(默认) | 标准 MCP review,和之前完全一样 | 日常使用 |
| `hard` | + Reviewer Memory(GPT 跨轮追踪疑点)+ 辩论协议(Claude 可反驳,GPT 裁决) | 想要更严格的反馈 |
| `nightmare` | + GPT 通过 `codex exec` 直接读代码仓库(Claude 无法过滤信息)+ 对抗性验证 | 投顶会前的极限压测 |
```bash
/auto-review-loop "topic" — difficulty: nightmare # GPT 自己读你的代码和结果来验证
```
**🛡️ 关键安全机制:**
- 🔒 **MAX_ROUNDS = 4** — 防止无限循环;达到分数阈值时提前停止
- ⏱️ **> 4 GPU-hour 的实验自动跳过** — 不会启动超大实验,标记为"需人工跟进"
- 🧠 **优先改叙事而非跑新实验** — 同样能解决问题时,选择成本更低的路径
- 🪞 **不隐藏弱点** — 明确规则:"不要隐藏弱点来骗高分"
- 🔧 **先修后审** — 必须实现修复后再重新 review,不能只承诺修
- 💾 **上下文压缩恢复** — 每轮结束后持久化状态到 `REVIEW_STATE.json`。如果上下文窗口满了触发自动 compact,工作流会从状态文件恢复断点继续——无需人工干预
> ⚙️ MAX_ROUNDS、分数阈值、GPU 限制均可配置——见[自定义](#%EF%B8%8F-自定义)。
📝 **博客:** [开源 | 睡觉 Claude 自动跑实验改文](http://xhslink.com/o/5cBMTDigNXz)
### 工作流 3:论文写作流水线 📝
> "把我的研究报告变成可投稿的 PDF。" 需要本地 LaTeX 环境——见[前置条件](#前置条件)。
1. 📝 **叙事** — 写 `NARRATIVE_REPORT.md`(声明 / 实验 / 结果 / 图表说明);模板见 [`templates/NARRATIVE_REPORT_TEMPLATE.md`](templates/NARRATIVE_REPORT_TEMPLATE.md)
2. 🧭 **规划** — `/paper-plan` 生成 claims-evidence 矩阵 + 分节计划
3. 📊 **画图** — `/paper-figure` 从 JSON/CSV 生成数据驱动的图表和对比表
4. ✍️ **写作** — `/paper-write` 逐 section 生成 LaTeX
5. 🔧 **编译** — `/paper-compile` 编 PDF、修错、跑页数验证
6. ✨ **润色** — `/auto-paper-improvement-loop` 跑 2 轮 GPT-5.4 内容审稿 + 终局格式合规检查
展开工作流 3 的写作流向图与命令清单 —— NARRATIVE_REPORT → /paper-plan → /paper-figure → /paper-write → /paper-compile → 润色循环
```
NARRATIVE_REPORT.md ──► /paper-plan ──► /paper-figure ──► /paper-write ──► /paper-compile
(研究叙事) (大纲+矩阵) (图表+LaTeX) (逐节LaTeX) (编译PDF)
```
```
典型流程:
1. 写 NARRATIVE_REPORT.md(来自工作流 2 的结果)
2. /paper-plan — 生成 claims-evidence 矩阵 + 分节计划
3. /paper-figure — 生成对比表、训练曲线等图表
4. /paper-write — 逐 section 生成 LaTeX(含 bib 清理、de-AI 打磨)
5. /paper-compile — 编译 PDF、修复错误、页数验证
6. /auto-paper-improvement-loop — 内容审稿 ×2 + 格式合规检查
```
**涉及 Skills:** `paper-plan` + `paper-figure` + `paper-write` + `paper-compile` + `auto-paper-improvement-loop` +(投稿后)`paper-poster` + `paper-slides`
> **一键调用:** `/paper-writing "NARRATIVE_REPORT.md"` 自动跑完整个工作流 3。
**输入:** 一份 `NARRATIVE_REPORT.md`,描述研究内容:声明、实验、结果、图表。叙事越详细(尤其是图表描述和定量结果),输出越好。
**输出:** 一个可投稿的 `paper/` 目录,含 LaTeX 源码、干净的 `.bib`(仅含实际引用)、编译好的 PDF。
展开工作流 3 的核心特性细节 —— Claims-Evidence 矩阵、bib 清理、figure 模式、ICLR 端到端实测
**核心特性:**
- 📐 **Claims-Evidence 矩阵** — 每个声明映射到证据,每个实验支撑一个声明
- 📊 **自动图表生成** — 从 JSON 数据生成折线图、柱状图、对比表
- 🧹 **Bib 自动清理** — 过滤未引用条目(实测 948→215 行)。通过 [DBLP](https://dblp.org)/[CrossRef](https://www.crossref.org) 获取真实 BibTeX,替代 LLM 生成
- 📄 **灵活节数** — 5-8 节按论文类型选择(理论论文常需 7 节)
- 🔍 **GPT-5.4 审稿** — 每步可选外部 LLM 审查
- ✂️ **De-AI 打磨** — 去除 AI 写作痕迹(delve、pivotal、landscape…)
- 🎯 **精确页数验证** — 基于 `pdftotext` 定位 Conclusion 结束位置
> ⚠️ **`/paper-figure` 能做什么、不能做什么:** 能自动生成**数据驱动的图表**(训练曲线、柱状图、热力图)和 **LaTeX 对比表**(从 JSON/CSV 数据)。**不能**生成架构图、流程图、模型示意图、生成样本网格——这些需要手动创建(draw.io、Figma、TikZ 等),放到 `figures/` 目录后再跑 `/paper-write`。一篇典型 ML 论文中,约 60% 的图表可自动生成,约 40% 需手动制作。
**端到端实测:** 从一份 NARRATIVE_REPORT.md 生成了一篇 9 页 ICLR 2026 理论论文(7 节、29 条引用、4 张图、2 个对比表)——零编译错误、零 undefined reference。
#### 论文自动润色循环 ✨
工作流 3 生成论文后,`/auto-paper-improvement-loop` 自动跑 2 轮 GPT-5.4 xhigh 内容审稿 → 修复 → 重编译,外加一轮格式合规检查,将粗稿自动提升到可投稿质量。
展开论文自动润色 benchmark —— 实测 ICLR 2026 理论论文分数轨迹(4/10 → 8.5/10)+ Round 1/2/3 详细修复清单
**分数变化(实测 — ICLR 2026 理论论文):**
| 轮次 | 分数 | 关键改动 |
|------|------|---------|
| Round 0 | 4/10(内容) | 基线生成论文 |
| Round 1 | 6/10(内容) | 修复假设、软化声明、重命名符号 |
| Round 2 | 7/10(内容) | 添加合成验证、强化局限性 |
| Round 3 | 5→8.5/10(格式) | 移除多余图、拆附录、压缩结论、修 overfull hbox |
**最终:正文 8 页(ICLR 限 9 页),0 个 overfull hbox,格式合规。** 3 轮共涨 4.5 分。
Round 1 修复细节(6 项)
1. **CRITICAL — 假设与模型矛盾**:有界性假设与模型的分布族不一致。改为与尾部兼容的假设,并添加正式截断桥接。
2. **CRITICAL — 理论-实验 gap**:理论假设理想化编码器,实验用学习的非线性编码器。软化 "validate" → "demonstrate practical relevance",添加明确声明。
3. **MAJOR — 缺定量指标**:添加参数量对比表(latent vs total),诚实计入系统总开销。
4. **MAJOR — 定理不自包含**:添加 "Interpretation" 段落,显式列出所有依赖。
5. **MAJOR — 新颖性声明过宽**:将宽泛的 "首个收敛保证" 精确限定到具体成立条件。
6. **MAJOR — 符号冲突**:重命名一个与另一关键变量冲突的符号。添加 Notation 段。
Round 2 修复细节(4 项)
1. **MAJOR — 缺理论验证实验**:添加合成验证子节,在受控条件下直接测试两个核心理论预测。
2. **MAJOR — 声明仍然过强**:将强等价声明替换为适当的 hedge 语言,全文统一。
3. **MAJOR — 非正式理论论证**:将非正式论证正式化为一个命题,给出显式误差界。
4. **MINOR — 局限性不足**:扩展为显式列出所有假设,承认缺少标准评估指标。
Round 3 格式修复(8 项)
1. 移除多余的 hero figure(省 ~0.7 页)
2. 压缩结论 15→9 行
3. 合成验证移至附录 A
4. 对比表格移至附录 B
5. 修复 overfull hbox (85pt),用 `\resizebox`
6. 添加紧凑 float spacing(`\captionsetup`、`\textfloatsep`)
7. Introduction 中行内化居中问题块
8. 收紧 `itemize` 环境间距
### 工作流 4:Rebuttal 📝(安全应对审稿意见)
> **"审稿意见来了。帮我写一份有根据、不夸大的 rebuttal。"**
`/rebuttal` 解析审稿意见,制定策略,起草符合 venue 规则(字数限制、纯文本等)的回复:
1. 📋 **解析** —— 规范化 review 文本,校验 venue 规则(字符限制、纯文本约束等)
2. 🔍 **原子化** —— 把每条 review 拆成 issue 卡片(类型、严重度、reviewer 立场)
3. 🗺️ **策略制定** —— 全局主题、per-reviewer 优先级、字符预算、被禁 claim
4. 🧪 **证据补跑**(可选)—— 如果 `auto experiment: true`,通过 `/experiment-bridge` 自动跑补充实验
5. ✍️ **起草** —— 全局开场 + per-reviewer 编号回复 + meta-reviewer 收尾
6. 🛡️ **安全检查** —— 6 道 lint:覆盖率、出处可追、承诺受控、语气、内部一致性、字符限制
7. 🔬 **GPT-5.4 压力测试** —— 内部怀疑式终审 draft
8. 📄 **定稿** —— 两份产物:`PASTE_READY.txt`(精确字数,直接粘贴投递)+ `REBUTTAL_DRAFT_rich.md`(扩展版用于人工编辑)
9. 🔄 **Follow-up 回合** —— reviewer 追问场景的 delta 回复,技术细节逐轮升级
展开工作流 4 的 rebuttal 流程图 —— 解析意见 → 策略 → 可选证据补跑 → 起草 → GPT-5.4 压测 → 双版本定稿 → follow-up 回合
```
┌─────────────────────────────────────────────────────────────────┐
│ 工作流 4:Rebuttal │
│ │
│ 审稿意见到达 │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 解析 + │────▶│ 策略 │────▶│ 证据 │ │
│ │ 原子化 │ │ 规划 │ │ 补跑 │ │
│ │ 审稿意见 │ │ │ │(可选) │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 定稿 │◀────│ GPT-5.4 │◀────│ 起草 │ │
│ │ 双版本 │ │ 压力测试 │ │ rebuttal │ │
│ │ │ │ │ │ │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │
│ ▼ │
│ PASTE_READY.txt(严格字数)+ RICH.md(扩展版) │
│ │ │
│ ▼ │
│ Follow-up 回合(delta 回复,per-reviewer threads) │
└─────────────────────────────────────────────────────────────────┘
```
**涉及 skill:** `rebuttal`
> 💡 **Quick mode:** `/rebuttal — quick mode: true` 跑完解析 + 策略(Phase 0-3)就停。先看 reviewer 想要什么,再决定要不要起草完整 draft。
> ⚙️ `VENUE`、`AUTO_EXPERIMENT`、`QUICK_MODE`、`MAX_STRESS_TEST_ROUNDS` 都可配置 —— 见 [自定义](#%EF%B8%8F-自定义)。
**三道安全门 —— 任何一项不过 rebuttal 不定稿:**
- 🔒 **出处可追** —— 每条 claim 都能追溯到 paper / review / 用户确认结果。不允许编造。
- 🔒 **承诺受控** —— 每个承诺都由用户批准。不允许过度承诺。
- 🔒 **完整覆盖** —— 每个 reviewer 关切都被记录。不允许遗漏。
### 工作流 5:Resubmit Pipeline 🔁(跨 venue 移植论文,纯文本)
> **"论文在 venue A 投完了,要移植到 venue B。在硬约束下完成。"**
`/resubmit-pipeline` 把已经打磨好的论文从一个 venue 移植到另一个,硬约束:**不跑新实验、不改 bib、不动 framework、永远不覆盖先前的 submission 目录**。用于会议→期刊扩刊版、ML venue → 另一个 ML venue、非匿名 workshop 之后的匿名重投。不适合大改(大改用 `/paper-writing`)。
1. 📁 **物理隔离** — 复制到 `/`;原 submission 目录绝不动。
2. 🛡️ **5 层匿名检查** — 作者名、机构、自引用、GitHub / Overleaf 链接、行文中"我们"指代——任何破坏双盲的内容都会被标出。
3. 🔬 **审计(soft-only 模式)** — `/proof-checker`、`/paper-claim-audit`、`/citation-audit --soft-only`。`--soft-only` 把 `KEEP/FIX/REPLACE/REMOVE` 判决翻译成正文改写建议(bib 冻结);幻觉引用走 `drop_cite_in_body_only` 动作。
4. ✏️ **微编辑** — `/auto-paper-improvement-loop --edit-whitelist `(YAML schema:`allowed_paths` / `forbidden_paths` / `forbidden_operations`(如 `new_cite` / `new_theorem_env` / `numerical_claim`)/ `forbidden_deletions` / `max_edits_per_round`)+ 每轮 diff gate。
5. 🗡 **对抗 gate** — `/kill-argument` 终审 attack/adjudication;任何 critical 级 `still_unresolved` 拒绝放行。
6. 📤 **编译 + 推送** — `/paper-compile` + 可选 `/overleaf-sync push`。
展开工作流 5 的 resubmit 流程图 —— 隔离副本 → 5 层匿名 → soft-only 审计 → 白名单微编辑 → /kill-argument 对抗 gate → 编译 + Overleaf push
```
┌──────────────────────────────────────────────────────────────────────┐
│ 工作流 5:纯文本 Resubmit │
│ │
│ 已打磨论文 │
│ │ │
│ ▼ │
│ 隔离 → 匿名(5 层)→ 审计(--soft-only) │
│ │ │
│ ▼ │
│ 微编辑(whitelist + diff gate)→ /kill-argument 对抗 gate │
│ │ │
│ ▼ │
│ 编译 + Overleaf push → / │
└──────────────────────────────────────────────────────────────────────┘
```
**涉及 skill:** `resubmit-pipeline`(orchestrator)、`auto-paper-improvement-loop --edit-whitelist`、`citation-audit --soft-only`、`proof-checker`、`paper-claim-audit`、`kill-argument`、`paper-compile`、`overleaf-sync`(可选)
**硬约束(不可覆盖):**
- 🔒 **不跑新实验** —— 论文里每个数字必须已经存在于源 paper。
- 🔒 **不改 bib** —— 引用问题走 `--soft-only` 翻译为正文改写。
- 🔒 **不改 framework** —— theorem 环境、claim 形态、贡献范围全部冻结。
- 🔒 **永不覆盖先前 submission** —— 新 venue 单独目录。
**主 ledger:** `RESUBMIT_REPORT.json` 含 7 态失败模式表(含 `USER_DECISION` runtime 状态),符合 `shared-references/assurance-contract.md`。完整 feature 见 [2026-05-05 News 条目](#-最近更新)。
### 工作流 6:Conference Talk Pipeline 🎤(论文 → slides → polish → audits)
> **"论文中了。现在准备会议演讲。"**
`/paper-talk` 是 `/paper-writing` 和 `/paper-poster` 的姊妹流水线,编排完整 talk 准备流程。`/slides-polish` 是内部调用的后处理打磨阶段——**不需要单独调**。
1. 📋 **大纲** —— 从 `paper/`(或 `NARRATIVE_REPORT.md`)抽取;每个贡献一个 slide 簇;段落映射到 talk beat。
2. 🎨 **生成** —— `/paper-slides` 出 Beamer 源码 + PPTX + 讲稿 + Q&A 准备。
3. 💎 **Polish** —— `/slides-polish` 对照 reference PDF 一页一页 Codex 审,套 fix-pattern catalog(PPTX 字号 1.5-1.8× 缩放保证投影可读、字号 bump 后 text frame resize、banner 用 tcolorbox、italic style 泄漏防御、em-dash 间距、中文 EA font 用 PingFang SC、anonymity placeholder 纪律)。
4. 🛡️ **审计**(当 `assurance: conference-ready`)—— `/paper-claim-audit` + `/citation-audit` 在合成 paper 目录上跑(slide 文字 + 讲稿 + 完整 script 物化成 `.aris/paper-talk/audit-input/sections/*.tex` + symlink 真实 `.bib` / `results/` / `figures/`),各输出 6 态 JSON verdict(见 `shared-references/assurance-contract.md`);任何非 green 阻断 Final Report。
展开工作流 6 的 talk-prep 流程图 —— paper → outline → /paper-slides → /slides-polish → 可选 conference-ready 审计 gate
```
┌──────────────────────────────────────────────────────────────────────┐
│ 工作流 6:会议演讲 │
│ │
│ paper/ → outline → /paper-slides (Beamer + PPTX + 讲稿) │
│ │ │
│ ▼ │
│ /slides-polish (per-page Codex 打磨) │
│ │ │
│ ▼ │
│ assurance: conference-ready ? │
│ ├─ yes → /paper-claim-audit + /citation-audit │
│ │ 在合成 paper staging adapter 上跑 │
│ │ → 6 态 verdict 决定 Final Report 是否放行 │
│ └─ no → 直出 Final Report │
└──────────────────────────────────────────────────────────────────────┘
```
**涉及 skill:** `paper-talk`(orchestrator)、`paper-slides`、`slides-polish`、`paper-claim-audit` + `citation-audit`(仅 `assurance: conference-ready`)
**Assurance 阶梯**(与 `effort` 轴正交):`draft / polished(默认)/ conference-ready`。合法组合:`— effort: lite, assurance: conference-ready` 意为「快流水线 + 每个 audit 必须出 verdict 才能 final」。
**单独使用 slide / poster 工具:** 只要 artifact 不要完整 orchestration,可直接 `/paper-slides "paper/"` 或 `/paper-poster "paper/"`,不经 `/paper-talk`。完整 feature 见 [2026-05-06 News 条目](#-最近更新)。
### 📚 Research Wiki — 持久化研究记忆
> **"不要每次重新推导。让知识复合增长。"** — 灵感来自 [Karpathy 的 LLM Wiki](https://gist.github.com/karpathy/442a6bf555914893e9891c11519de94f)
没有 wiki 时,ARIS 是无状态的——每次 `/idea-discovery` 从零开始。有了 wiki,ARIS 跨研究全生命周期积累:读过的论文、试过的 idea、跑过的实验、验证过的 claim。
**核心洞察:** 失败的 idea 是最宝贵的记忆。知道什么不行的研究者,比从零开始的研究者更强。
**启用:**
```
> /research-wiki init # 一次性初始化,在项目中创建 research-wiki/
```
**就这样。** 初始化后自动工作:
| 时机 | 发生了什么 | Wiki 操作 |
|------|-----------|----------|
| `/research-lit` 找到论文 | 论文自动入库 | 创建 `papers/.md`,添加关系边 |
| `/idea-creator` 运行 | 先读 wiki | 失败 idea = 禁止列表,gap = 搜索种子 |
| `/idea-creator` 完成 | 所有 idea 写回 | 推荐的 + 被淘汰的都写 → `ideas/.md` |
| `/result-to-claim` 判定 | 结果写回 | 实验页面,claim 状态更新(支持/否定) |
| 3+ idea 失败 | 建议重新构思 | "💡 wiki 已经知道什么不行了,考虑重新 ideate" |
展开 Research Wiki 的数据模型、螺旋上升示例和手动子命令 —— 四种实体、3 轮"失败 idea → 更好 idea"演化、ingest/query/lint/stats
**四种实体:** 📄 论文、💡 想法、🧪 实验、📋 声明
**螺旋上升:**
```
第 1 轮:读 15 篇论文 → idea A → 实验 → 失败 → wiki 记住"A 因为 OOM 失败"
第 2 轮:wiki 知道 A 不行 → idea D(避开 A 的坑)→ 部分成功 → wiki 记住
第 3 轮:综合 A 失败 + D 部分成功 → idea F → 成功 🎉
```
**子命令:**
```
/research-wiki init # 初始化
/research-wiki ingest "论文标题" — arxiv: xxx # 手动添加论文
/research-wiki query "主题" # 重建 query_pack.md
/research-wiki lint # 健康检查
/research-wiki stats # 统计概览
```
> 🔒 **安全设计:** 所有 hook 都有 `if wiki 存在` 守卫。没初始化 = 零影响。纯 Python 标准库,无依赖。
---
### 工作流 M:Meta-Optimize 🧬(ARIS 优化自己)
> **"分析我的使用模式,改进你自己的技能。"**
与工作流 1–4 优化*研究产物*(论文、代码、实验)不同,工作流 M 优化的是 *harness 本身*——SKILL.md 指令、默认参数和收敛规则。灵感来自 [Meta-Harness](https://arxiv.org/abs/2603.28052)(Lee et al., 2026)。
展开工作流 M 的一次性设置与使用命令 —— Claude Code hook 安装、/meta-optimize 各变体(项目 / 单 skill / --global / apply)
**设置(一次性,在普通终端):**
```bash
mkdir -p .claude .aris/meta tools/meta_opt
cp Auto-claude-code-research-in-sleep/templates/claude-hooks/meta_logging.json .claude/settings.json
cp Auto-claude-code-research-in-sleep/tools/meta_opt/*.sh tools/meta_opt/
chmod +x tools/meta_opt/*.sh
claude # hooks 立即生效
```
**使用(累积 5 次以上工作流运行后):**
```
> /meta-optimize # 分析当前项目
> /meta-optimize "auto-review-loop" # 聚焦单个技能
> /meta-optimize --global # 分析跨项目的使用趋势
> /meta-optimize apply 1 # 应用推荐的修改 #1
```
**工作原理:**
1. 📊 **被动记录** — hooks 静默记录每次技能调用、工具执行、失败、参数覆盖。事件同时写入**项目级**(`.aris/meta/events.jsonl`)和**全局**(`~/.aris/meta/events.jsonl`,带 `"project"` 标签)两份日志
2. 🔍 **模式分析** — 识别高频覆盖参数(默认值不好)、重复失败(缺少错误处理)、分数停滞(收敛规则需调整)
3. 🩹 **生成 Patch** — 对目标 SKILL.md 生成最小修改 + 数据支撑的理由
4. 🔬 **Reviewer 审核** — GPT-5.4 xhigh 评估每个 patch 是否安全
5. ✅ **用户批准** — 从不自动应用,用户说了算
展开工作流 M 的流程图与"优化对象"列表 —— 事件日志 → SKILL.md patch → GPT-5.4 审核 → 用户批准;prompt / 默认参数 / 收敛规则 / 错误处理
```
┌─────────────────────────────────────────────────────────────────┐
│ 工作流 M:Meta-Optimize │
│ │
│ 正常 ARIS 使用(W1-W4) │
│ │ (hooks 被动记录事件) │
│ ▼ │
│ .aris/meta/events.jsonl │
│ │ │
│ ▼ │
│ ┌──────────┐ ┌──────────┐ ┌──────────┐ │
│ │ 分析模式 │────▶│ 提出 │────▶│ GPT-5.4 │ │
│ │ │ │ SKILL.md │ │ 审核 │ │
│ │ │ │ 修改 │ │ patch │ │
│ └──────────┘ └──────────┘ └──────────┘ │
│ │ │
│ ▼ │
│ 用户批准? │
│ 是 → 应用 │
│ 否 → 跳过 │
└─────────────────────────────────────────────────────────────────┘
```
**优化对象(harness 组件):** 技能 prompt、默认参数(`difficulty`、`MAX_ROUNDS`、`threshold`)、收敛规则、错误处理模式。
**不优化:** 研究产物(论文、代码、实验)——那是 W1–W4 的工作。
> 💡 这是**维护工作流**,不属于 W1→W1.5→W2→W3→W4 研究流水线。像 `git gc` 一样定期运行。
---
### ⚡ Effort Levels
> **"ARIS 应该花多大力气?"** — 每个 skill 都接受 `— effort: lite | balanced | max | beast`。
| 等级 | Token | 适合 |
|------|:-----:|------|
| `lite` | ~0.4x | 快速探索,预算有限 |
| `balanced` | 1x | 日常科研(**默认**) |
| `max` | ~2.5x | 投稿准备 |
| `beast` | ~5-8x | 顶会冲刺,全部拉满 |
**不变项**:Codex reasoning 永远 **xhigh**,DBLP 引用永远开,reviewer 独立性永远开。
> 📖 完整规范:[`shared-references/effort-contract.md`](skills/shared-references/effort-contract.md)
### 🧿 可选:GPT-5.4 Pro via Oracle
> **给需要最强审稿者的专家研究者。**
[Oracle](https://github.com/steipete/oracle) 解锁 **GPT-5.4 Pro** 作为 ARIS 审稿者——最强推理模型。适合数学证明验证、逐行代码审计和复杂实验设计评审。
**用法:** 给任意 reviewer-aware skill(`/research-review`、`/proof-checker`、`/experiment-audit`、`/auto-review-loop`、`/idea-creator`、`/rebuttal` 等)加 `— reviewer: oracle-pro`。
**默认永远是 Codex xhigh。** Oracle 未安装 = 零影响。`— reviewer: oracle-pro` 在未装 Oracle 时优雅降级到 Codex 并给警告。
展开 Oracle 安装命令与各 skill 示例 —— npm install、claude mcp add、API / 浏览器模式选择、4 个 reviewer-aware skill 示例
**设置:**
```bash
npm install -g @steipete/oracle # 安装 Oracle
claude mcp add oracle -s user -- oracle-mcp # 添加 MCP
# 重启 Claude Code
export OPENAI_API_KEY="your-key" # API 模式(快)
# 或:在 Chrome 登录 chatgpt.com # 浏览器模式(免费)
```
**示例 — 给任意 skill 加 `— reviewer: oracle-pro`:**
```bash
/research-review "草稿" — reviewer: oracle-pro
/proof-checker "paper/" — reviewer: oracle-pro
/experiment-audit — reviewer: oracle-pro
/auto-review-loop "范围" — reviewer: oracle-pro
```
> 📖 完整规范:[`shared-references/reviewer-routing.md`](skills/shared-references/reviewer-routing.md)
---
## 🧰 Skills Catalog
ARIS 现有 **74+ 个 skill**,覆盖文献调研、idea 生成、实验、审计、论文写作、
演讲、专利、meta 工具等。完整目录(每个 skill 含 role / category /
依赖)在
**[`docs/SKILLS_CATALOG.md`](docs/SKILLS_CATALOG.md)**,独立成文以保持
README 可扫读。
**常用入口:**
| 场景 | 入口 skill |
|---|---|
| 端到端研究(idea → paper) | [`/research-pipeline`](skills/research-pipeline/SKILL.md) |
| Idea 发现 + 方案精炼 | [`/idea-discovery`](skills/idea-discovery/SKILL.md) |
| 按计划跑实验 | [`/experiment-bridge`](skills/experiment-bridge/SKILL.md) |
| 自动 review → 修 → 再 review | [`/auto-review-loop`](skills/auto-review-loop/SKILL.md) |
| 报告 → 打磨 PDF | [`/paper-writing`](skills/paper-writing/SKILL.md) |
| 回应审稿意见 | [`/rebuttal`](skills/rebuttal/SKILL.md) |
| 跨 venue 移植论文 | [`/resubmit-pipeline`](skills/resubmit-pipeline/SKILL.md) |
| 论文 → 会议演讲 | [`/paper-talk`](skills/paper-talk/SKILL.md) |
| 持久化研究记忆 | [`/research-wiki`](skills/research-wiki/SKILL.md) |
| 专利撰写(CN / US / EP) | [`/patent-pipeline`](skills/patent-pipeline/SKILL.md) |
| ARIS 自我优化 | [`/meta-optimize`](skills/meta-optimize/SKILL.md) |
→ **[按 category 浏览全部 74 个 skill →](docs/SKILLS_CATALOG.md)**
---
## ⚙️ 安装
### 前置条件
1. 安装 [Claude Code](https://docs.anthropic.com/en/docs/claude-code)
2. (仅 review 类 skill 需要)安装 [Codex CLI](https://github.com/openai/codex) 并配置为 MCP server:
```bash
npm install -g @openai/codex
claude mcp add codex -s user -- codex mcp-server
```
3. (仅工作流 3:论文写作需要)**LaTeX** 环境,含 `latexmk` 和 `pdfinfo`:
```bash
# macOS
brew install --cask mactex # 或: brew install basictex
brew install poppler # 提供 pdfinfo
# Ubuntu/Debian
sudo apt install texlive-full latexmk poppler-utils
# 验证
latexmk --version && pdfinfo -v
```
> 如果只用工作流 1 和 2(找 idea + 自动 review),不需要安装 LaTeX。
### 安装 Skills
> 💡 **推荐:项目级扁平 symlink 安装**(2026-04-20 起)。每个 ARIS skill 独立 symlink 到 `.claude/skills/`,让 Claude Code 的 slash command 自动补全能直接发现。manifest 在 `.aris/installed-skills.txt` 跟踪 ARIS 装了什么——uninstall 和 reconcile 只动 manifest 里的条目,绝不碰你自己的 skill。
>
> 🤖 **Codex mirror 路线:** Claude 主线继续使用 `install_aris.sh` / `smart_update.sh`。Codex 原生项目安装请用 `install_aris_codex.sh`,Codex copy 安装更新请用 `smart_update_codex.sh`。
```bash
# 1. 克隆 ARIS 一次到稳定位置
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git ~/aris_repo
# 2. 在每个使用 ARIS 的项目里 attach:
cd ~/your-paper-project
bash ~/aris_repo/tools/install_aris.sh
# → 每个 skill 一个 symlink: .claude/skills/ → ~/aris_repo/skills/
# → 写 manifest .aris/installed-skills.txt(追踪 ARIS 装的每条)
# → 更新 CLAUDE.md ARIS 管理块(best-effort + compare-and-swap,不会覆盖用户改动)
# → 可重入:再跑一次会自动 reconcile 上游的新增/删除
# 3. 已有 skill 的内容更新:直接 git pull(symlink 指向上游,自动跟随)
cd ~/aris_repo && git pull
# 3a. 上游新增 / 删除 skill 时,重跑安装器(一次的事):
bash ~/aris_repo/tools/install_aris.sh ~/your-paper-project
# 其他常用:
bash ~/aris_repo/tools/install_aris.sh --dry-run # 看计划,不写盘
bash ~/aris_repo/tools/install_aris.sh --uninstall # 按 manifest 卸载(不动你自己的 skill)
bash ~/aris_repo/tools/install_aris.sh --from-old # 从老的 .claude/skills/aris/ 嵌套布局迁移
# Windows(PowerShell,需要管理员权限或开发者模式以创建 junction):
.\tools\install_aris.ps1 C:\path\to\your-paper-project
```
**为什么 git pull 不能完全代替重跑安装器:** 扁平布局是每个 skill 一个 symlink,所以上游**新增/删除** skill 时,project 里要新增/移除对应的 symlink——这一步只能由安装器做。这个代价换来了 Claude Code 的自动 slash command 发现(CC 只扫一层目录)。
从老的嵌套布局迁移(2026-04-20 之前的安装)
如果你之前用的是 `install_aris.sh`(创建 `.claude/skills/aris/` 嵌套 symlink)或 `smart_update.sh --target-subdir .claude/skills/aris`(嵌套 copy),那你的 slash command 大概率没被 Claude Code 自动发现。迁移到扁平布局:
```bash
# Symlink 老安装:
bash ~/aris_repo/tools/install_aris.sh ~/your-project --from-old
# Copy 老安装(可能有本地编辑——需要显式选策略):
bash ~/aris_repo/tools/install_aris.sh ~/your-project --from-old --migrate-copy keep-user
# → 保留嵌套 .claude/skills/aris/ 不动,扁平 symlink 装在旁边
bash ~/aris_repo/tools/install_aris.sh ~/your-project --from-old --migrate-copy prefer-upstream
# → 把嵌套副本归档到 .aris/legacy-copy-backup-/,再扁平化
```
其他安装方式(进阶)
**项目级 copy(不要 symlink,适合需要为单个项目定制 skill 内容):**
```bash
mkdir -p ~/your-project/.claude/skills
bash ~/aris_repo/tools/smart_update.sh --project ~/your-project --apply
# 默认 --target-subdir 是 .claude/skills(扁平),这是 Claude Code 期望的布局。
# (老的 --target-subdir .claude/skills/aris 已弃用,见上面的迁移段。)
```
**全局安装(一份 copy 在 home 目录,所有项目可用):**
```bash
mkdir -p ~/.claude/skills
cp -r ~/aris_repo/skills/* ~/.claude/skills/
# 更新:bash tools/smart_update.sh --apply
```
> 全局安装会增加和其他全局 skill 包名字冲突的风险。只在不混装 ARIS 与 Superpowers / OpenHands 等的情况下使用——否则用上面的项目级安装。
### 更新 Skills
```bash
cd Auto-claude-code-research-in-sleep
git pull
# 方案 A:全量更新(用最新版覆盖所有 skill)
cp -r skills/* ~/.claude/skills/
# 方案 B:安全更新(只加新 skill,保留你的定制)
cp -rn skills/* ~/.claude/skills/
# 方案 C:只更新指定 skill
cp -r skills/experiment-bridge ~/.claude/skills/
```
> 💡 **选哪个?** 没改过 skill 用 **A**。改过用 **B**(新 skill 会加进来,你的改动保留——但改过的文件不会收到上游 bug fix)。**C** 精确更新。
### 🌙 过夜自动运行的免确认配置(可选)
在 `.claude/settings.local.json` 中添加:
```json
{
"permissions": {
"allow": [
"mcp__codex__codex",
"mcp__codex__codex-reply",
"Write",
"Edit",
"Skill(auto-review-loop)"
]
}
}
```
🖥️ GPU 服务器配置(自动跑实验用)
当 GPT-5.4 审稿说"需要补一个消融实验"或"加一个 baseline 对比"时,Claude Code 会自动写实验脚本并部署到你的 GPU 服务器。为此,Claude Code 需要知道你的服务器环境。
在项目的 `CLAUDE.md` 中添加服务器信息:
```markdown
## 远程服务器
- SSH:`ssh my-gpu-server`(密钥免密登录)
- GPU:4x A100
- Conda 环境:`research`(Python 3.10 + PyTorch)
- 激活:`eval "$(/opt/conda/bin/conda shell.bash hook)" && conda activate research`
- 代码目录:`/home/user/experiments/`
- 后台运行用 `screen`:`screen -dmS exp0 bash -c '...'`
```
Claude Code 读到这些就知道怎么 SSH、激活环境、启动实验。GPT-5.4(审稿人)只决定**做什么实验**——Claude Code 根据你的 `CLAUDE.md` 搞定**怎么跑**。
如果你已经在 GPU 服务器上,可以添加以下到你的 `CLAUDE.md`:
```markdown
## GPU 环境
- 这台机器有直接 GPU 访问(不需要 SSH)
- GPU:4x A100 80GB
- 实验环境:`YOUR_CONDA_ENV`(Python 3.x + PyTorch)
- 激活前任何 Python 命令:`激活实验环境的命令`(uv, conda 等)
- 代码目录:`/home/YOUR_USERNAME/YOUR_CODE_DIRECTORY/`
```
**没有 GPU 服务器?** Review 和改写功能不受影响,只有需要跑实验的修复会被跳过(标记为"需人工跟进")。或者按需租 GPU 跑实验,见下方 Vast.ai 集成。
☁️ Vast.ai 按需 GPU(可选)
没 GPU?从 [Vast.ai](https://vast.ai) 按需租。ARIS 分析你的训练任务(模型大小、数据集、时间),找能放下的最便宜 GPU,按**总成本**(不是 $/hr)排序展示,然后租 → 跑 → 收 → 销毁全自动。
在项目 `CLAUDE.md` 加:
```markdown
## Vast.ai
- gpu: vast # 从 vast.ai 按需租 GPU
- auto_destroy: true # 实验跑完自动销毁(默认)
- max_budget: 5.00 # 可选:估算超过这个数会警告
```
**📖 完整配置指南 → [docs/integrations/VAST_GPU_GUIDE_CN.md](docs/integrations/VAST_GPU_GUIDE_CN.md)** 包含:
- 账号 + `vastai` CLI + API key + SSH key 准备工作(5 个步骤)
- ARIS 如何挑 GPU 并展示实时成本排序表
- 手动租用:`/vast-gpu`(list / rent / destroy)
- 典型花费区间(RTX 4090 消融 ~$0.30-2/次,A100/H100 baseline ~$2-10/次)
- 什么时候用 `gpu: vast` 比 `gpu: remote` / `gpu: local` 更划算
**也不想租?** Review 和改写类 skill 仍可用,只有需要跑实验的修复会被跳过(标记为"需人工跟进")。
📚 Zotero 集成(可选)
把 Zotero 文献库接到 `/research-lit` —— 搜索 collections、读标注/高亮、导出 BibTeX,全在联网搜索**之前**完成。推荐 MCP:[zotero-mcp](https://github.com/54yyyu/zotero-mcp)(1.8k⭐,语义搜索 + PDF 标注 + BibTeX 导出)。
**📖 完整配置指南 → [docs/integrations/ZOTERO_CN.md](docs/integrations/ZOTERO_CN.md)** 包含:
- `zotero-mcp` 安装(本地 API 适合桌面端,或 Web API)
- API key + user ID 配置
- 启用后 `/research-lit` 新增能力(语义搜索、collections、PDF 标注、BibTeX 导出)
- 配置后新的默认源顺序:Zotero → Obsidian → 本地 PDF → 网络
- Zotero + Obsidian 组合工作流
**不用 Zotero?** `/research-lit` 自动跳过,用本地 PDF + 网络搜索。
📓 Obsidian + arXiv 集成(可选)
把 Obsidian vault 接到 `/research-lit` —— 搜索你的笔记、带标签的引用、加工后的洞察(通常比原始论文更有价值)。推荐 MCP:[mcpvault](https://github.com/bitbonsai/mcpvault)(760⭐,不需要打开 Obsidian)。和 Zotero 天然搭配。**arXiv 内置无需配置**,`/research-lit` 会自动查 arXiv API。
**📖 完整配置指南 → [docs/integrations/OBSIDIAN_CN.md](docs/integrations/OBSIDIAN_CN.md)** 包含:
- `mcpvault` 安装(指向 vault 路径,BM25 搜索,14 个工具)
- 可选 [obsidian-skills](https://github.com/kepano/obsidian-skills)(13.6k⭐,Obsidian CEO 维护)支持 wikilinks/callouts
- 启用后 `/research-lit` 新增能力(vault 搜索、tag 过滤、加工后总结、wikilink 遍历)
- Zotero + Obsidian 组合工作流
- arXiv 默认行为 + 怎么开启 PDF 下载(`— arxiv download: true`)
- 独立的 `/arxiv "topic"` 和 `/arxiv 2301.07041 — download`
**不用 Obsidian?** `/research-lit` 自动跳过,照常工作。arXiv 不受影响。
📱 飞书/Lark 集成(可选)
实验跑完、review 出分、checkpoint 等你审批——手机收飞书通知,不用守在终端前。
| 仅推送(群聊卡片) | 双向交互(私聊) |
|:-:|:-:|
|
|
|
**三种模式,按需选择:**
| 模式 | 效果 | 你需要 |
|------|------|--------|
| **关闭**(默认) | 什么都不做,纯 CLI 不变 | 什么都不用 |
| **仅推送** | 关键事件发 webhook 通知,手机收推送,不能回复 | 飞书机器人 webhook URL |
| **双向交互** | 全双工:在飞书里审批/拒绝 idea、回复 checkpoint | [feishu-claude-code](https://github.com/joewongjc/feishu-claude-code) 运行中 |
**📖 完整配置指南 → [docs/integrations/FEISHU_CN.md](docs/integrations/FEISHU_CN.md)** 包含:
- **仅推送配置(5 分钟)** —— 建群机器人、复制 webhook URL、丢 `~/.claude/feishu.json`、curl 测试
- **双向交互配置(15 分钟)** —— 飞书开放平台建应用、5 个必开权限(含极易漏的 `im:message.p2p_msg:readonly`)、`feishu-claude-code` 桥接安装、screen 部署
- 卡片颜色/内容对照表(Review ≥ 6 → 绿、< 6 → 橙、出错 → 红 等)
- 哪些 skill 会发通知、每个 skill 的推送 vs 交互 payload
- 机器人不回复的常见问题排查表
- 其他 IM 平台([cc-connect](https://github.com/chenhg5/cc-connect)、[clawdbot-feishu](https://github.com/m1heng/clawdbot-feishu)、[lark-openapi-mcp](https://github.com/larksuite/lark-openapi-mcp))
**不用飞书?** 没有 `~/.claude/feishu.json` 文件时,所有 skill 行为完全不变。零开销,零副作用。
## 🎛️ 自定义
Skills 就是普通的 Markdown 文件,fork 后随意改:
> 💡 **参数自动透传**:参数沿调用链自动向下传递。例如 `/research-pipeline "方向" — sources: zotero, arxiv download: true` 会将 `sources` 和 `arxiv download` 经 `idea-discovery` 一路传到 `research-lit`。这同样适用于 `deepxiv` 和 `exa` 这类可选源:`/research-pipeline "方向" — sources: all, deepxiv, exa`。你可以在任何层级设置下游参数——只需加 `— key: value`。
>
> ```
> research-pipeline ──→ idea-discovery ──→ research-lit
> ──→ experiment-bridge ──→ run-experiment
> ──→ auto-review-loop
> ──→ idea-creator
> ──→ novelty-check
> ──→ research-review
> ```
### 全流程(`research-pipeline`)
调端到端行为:GPU 目标、arXiv 下载、代码审查、人工 checkpoint、base repo、W&B 日志、精简摘要、参考论文、作图后端,以及自动继续。
行内覆盖:`/research-pipeline "方向" — auto proceed: false, wandb: true, illustration: true`
展开 /research-pipeline 的常量、默认值与透传
| 常量 | 默认值 | 说明 | 透传 |
|------|--------|------|:---:|
| `AUTO_PROCEED` | true | 用户不回复时自动带着最优方案继续 | → `idea-discovery` |
| `ARXIV_DOWNLOAD` | false | 搜索后自动下载最相关的 arXiv PDF | → `idea-discovery` → `research-lit` |
| `HUMAN_CHECKPOINT` | false | 设为 `true` 时每轮 review 后暂停等待确认 | → `auto-review-loop` |
| `WANDB` | false | 自动给实验脚本加 W&B 日志 | → `experiment-bridge` → `run-experiment` |
| `CODE_REVIEW` | true | GPT-5.4 部署前审查实验代码 | → `experiment-bridge` |
| `BASE_REPO` | false | GitHub 仓库 URL,克隆作为实验基础代码 | → `experiment-bridge` |
| `GPU` | `local` | GPU 目标:`local`、`remote`(SSH)、或 `vast`([Vast.ai](https://vast.ai) 按需租用) | → `experiment-bridge` → `run-experiment` |
| `COMPACT` | false | 生成精简摘要文件,适合短 context 模型和 session 恢复 | → 所有工作流 |
| `REF_PAPER` | false | 参考论文(PDF 或 URL),先总结再基于它找 idea | → `idea-discovery` |
| `ILLUSTRATION` | `gemini` | AI 作图:`gemini`(默认,需 API key)、`mermaid`(免费)、`false`(跳过) | → `paper-writing` |
### 自动 Review 循环(`auto-review-loop`)
调停止条件:review→修复 轮数上限、判定"可投稿"的分数阈值、超过哪个 GPU-小时预算的实验自动标记为需人工跟进。
展开 /auto-review-loop 的停止条件
| 常量 | 默认值 | 说明 |
|------|--------|------|
| `MAX_ROUNDS` | 4 | 最多 review→修复→再 review 轮数 |
| `POSITIVE_THRESHOLD` | 6/10 | 达到此分数自动停止(可投稿) |
| `> 4 GPU-hour 跳过` | 4h | 超过此时长的实验标记为"需人工跟进" |
### 找 Idea(`idea-discovery` / `idea-creator`)
调 pilot 阶段:单 pilot 最大耗时、硬超时、并行 pilot 数、总 GPU 预算,外加自动继续和 arXiv 下载开关。
行内覆盖:`/idea-discovery "方向" — pilot budget: 4h per idea, sources: zotero, arxiv download: true`
展开 /idea-discovery 与 /idea-creator 的 pilot 预算常量
| 常量 | 默认值 | 说明 | 透传 |
|------|--------|------|:---:|
| `PILOT_MAX_HOURS` | 2h | 单个 pilot 预估超时则跳过 | — |
| `PILOT_TIMEOUT_HOURS` | 3h | 硬超时——强制终止,收集部分结果 | — |
| `MAX_PILOT_IDEAS` | 3 | 最多并行 pilot 几个 idea | — |
| `MAX_TOTAL_GPU_HOURS` | 8h | 所有 pilot 的总 GPU 预算 | — |
| `AUTO_PROCEED` | true | 用户不回复时自动带着最优方案继续。设 `false` 则每步都等确认 | — |
| `ARXIV_DOWNLOAD` | false | 搜索后自动下载最相关的 arXiv PDF | → `research-lit` |
### 实验桥接(`experiment-bridge`)
调部署安全:GPT-5.4 代码审查、审查后自动部署、最小实验先跑、并行上限、W&B 日志、base repo URL。
行内覆盖:`/experiment-bridge — code review: false, wandb: true`
展开 /experiment-bridge 的部署与安全常量
| 常量 | 默认值 | 说明 |
|------|--------|------|
| `CODE_REVIEW` | true | GPT-5.4 xhigh 部署前审查代码。在浪费 GPU 前抓逻辑 bug |
| `AUTO_DEPLOY` | true | 实现 + 审查后自动部署。设 `false` 可手动检查 |
| `BASE_REPO` | false | GitHub 仓库 URL,克隆作为实验基础代码 |
| `SANITY_FIRST` | true | 先跑最小实验,提前发现 bug |
| `MAX_PARALLEL_RUNS` | 4 | 最多并行部署几个实验(受可用 GPU 限制) |
| `WANDB` | false | 自动加 W&B 日志。需在 CLAUDE.md 配 `wandb_project` |
### 文献搜索(`research-lit`)
调来源:本地 PDF 目录、本地扫描上限、搜索哪些源(Zotero / Obsidian / 网络 / Semantic Scholar / DeepXiv / Exa),以及 arXiv PDF 自动下载设置。
行内覆盖:`/research-lit "方向" — sources: zotero, web`、`/research-lit "方向" — sources: all, deepxiv`、`/research-lit "方向" — sources: all, exa`、`/research-lit "方向" — arxiv download: true, max download: 10`
展开 /research-lit 的源选择和 arXiv 下载常量
| 常量 | 默认值 | 说明 |
|------|--------|------|
| `PAPER_LIBRARY` | `papers/`, `literature/` | 本地论文目录,搜外部之前先扫这里的 PDF |
| `MAX_LOCAL_PAPERS` | 20 | 最多扫描多少本地 PDF(每篇读前 3 页) |
| `SOURCES` | `all` | 搜索哪些源:`zotero`、`obsidian`、`local`、`web`、`semantic-scholar`、`deepxiv`、`exa`、`all`(逗号分隔)。`semantic-scholar`、`deepxiv` 和 `exa` 需显式指定 |
| `ARXIV_DOWNLOAD` | false | 设为 `true` 时,搜索后自动下载最相关的 arXiv PDF 到 PAPER_LIBRARY |
| `ARXIV_MAX_DOWNLOAD` | 5 | `ARXIV_DOWNLOAD = true` 时最多下载的 PDF 数量 |
### 论文写作(`paper-write`)
调论文格式:DBLP 真实 BibTeX、目标会议(ICLR/NeurIPS/ICML/CVPR/ACL/AAAI/IEEE…)、匿名作者块、页数上限、作图后端。
行内覆盖:`/paper-write — target venue: NeurIPS, illustration: true`
展开 /paper-write 的论文格式与作图常量
| 常量 | 默认值 | 说明 |
|------|--------|------|
| `DBLP_BIBTEX` | true | 从 DBLP/CrossRef 拉取真实 BibTeX,替代 LLM 生成的条目 |
| `TARGET_VENUE` | `ICLR` | 目标会议/期刊格式:`ICLR`、`NeurIPS`、`ICML`、`CVPR`、`ACL`、`AAAI`、`ACM`、`IEEE_JOURNAL`、`IEEE_CONF` |
| `ANONYMOUS` | true | 匿名审稿模式。注意:大多数 IEEE 期刊/会议不匿名,IEEE 时设为 `false` |
| `MAX_PAGES` | 9 | 页数上限。ML 会议:正文不含参考文献。IEEE:总页数含参考文献 |
| `ILLUSTRATION` | `gemini` | AI 作图:`gemini`(默认,需 API key)、`mermaid`(免费)、`false`(跳过) |
### 通用(所有使用 Codex MCP 的 skill)
调所有 Codex MCP 调用使用的 reviewer 模型(默认 `gpt-5.5`),或者 fork SKILL.md 定制 prompt 模板与每个 skill 的工具白名单。
- **Prompt 模板** — 定制评审人格和评估标准
- **`allowed-tools`** — 限制或扩展每个 skill 可用的工具
展开 Codex MCP reviewer 模型选项
| 常量 | 默认值 | 说明 |
|------|--------|------|
| `REVIEWER_MODEL` | `gpt-5.5` | Codex MCP 调用的 OpenAI 模型。其他可选:`gpt-5.3-codex`、`gpt-5.2-codex`、`o3`。完整列表见 [supported models](https://developers.openai.com/codex/models/) |
## 🔀 替代模型组合
没有 Claude / OpenAI API?可以换用其他模型——同样的跨模型架构,不同的提供商。
> ⭐ **强烈推荐使用 Claude + GPT-5.4(默认组合)。** 这是经过最充分测试、最稳定的组合。替代方案可用但可能需要调整 prompt。
除了默认的 Claude × GPT-5.4,ARIS 还内置 **9 条替代路由(方案 A-I)**,覆盖 Z.ai 的 GLM、阿里百炼的 Kimi/Qwen/GLM/MiniMax 套餐、ModelScope 免费的 DeepSeek-V3.1、Codex 作为执行者搭配 Claude 或 Gemini 审稿、以及 Google Antigravity 作为执行器。
展开完整路由表 —— 默认 + 方案 A-I × 执行者 / 审稿人 / 是否需要 Claude API / 是否需要 OpenAI API / 配置指南链接
| | 执行者 | 审稿人 | 需要 Claude API? | 需要 OpenAI API? | 配置指南 |
|---|--------|--------|:---:|:---:|---------|
| **默认** ⭐ | Claude Opus/Sonnet | GPT-5.4(Codex MCP) | 是 | 是 | [快速开始](#-快速开始) |
| **方案 A** | GLM-5(Z.ai) | GPT-5.4(Codex MCP) | 否 | 是 | [配置见下](#方案-a-glm--gpt) |
| **方案 B** | GLM-5(Z.ai) | MiniMax-M2.7 | 否 | 否 | [MINIMAX_MCP_GUIDE](docs/MINIMAX_MCP_GUIDE.md) |
| **方案 C** | 任意 CC 兼容 | 任意 OpenAI 兼容 | 否 | 否 | [LLM_API_MIX_MATCH_GUIDE](docs/LLM_API_MIX_MATCH_GUIDE.md) |
| **方案 D** | Kimi-K2.5 / Qwen3.5+ | GLM-5 / MiniMax-M2.7 | 否 | 否 | [ALI_CODING_PLAN_GUIDE](docs/ALI_CODING_PLAN_GUIDE.md) |
| **方案 E** 🆓 | DeepSeek-V3.1 / Qwen3-Coder | DeepSeek-R1 / Qwen3-235B | 否 | 否 | [MODELSCOPE_GUIDE](docs/MODELSCOPE_GUIDE.md) |
| **方案 F** | Codex CLI (GPT-5.4) | Codex `spawn_agent` (GPT-5.4) | 否 | 是 | [skills-codex/](skills/skills-codex/) |
| **方案 G** 🆕 | Codex CLI | Claude Code CLI(`claude-review` MCP) | 否* | 否* | [CODEX_CLAUDE_REVIEW_GUIDE_CN](docs/CODEX_CLAUDE_REVIEW_GUIDE_CN.md) |
| **方案 H** 🆕 | Antigravity(Claude Opus 4.6 / Gemini 3.1 Pro) | GPT-5.4(Codex MCP)或 llm-chat | 否 | 可选 | [ANTIGRAVITY_ADAPTATION_CN](docs/ANTIGRAVITY_ADAPTATION_CN.md) |
| **方案 I** 🆕 | Codex CLI | Gemini direct API(`gemini-review` MCP) | 否 | 否 | [CODEX_GEMINI_REVIEW_GUIDE_CN](docs/CODEX_GEMINI_REVIEW_GUIDE_CN.md) |
**怎么选:**
- **默认** —— 你有 Claude + OpenAI 双账号,想要最稳的路径。
- **方案 A** —— 只换执行者(Claude → GLM),审稿人保留 GPT-5.4 via Codex MCP。
- **方案 B** 或 **方案 E** —— 不用 Claude、不用 OpenAI API(方案 E 通过 ModelScope 免费)。
- **方案 C** 或 **方案 D** —— OpenAI 兼容 API 自由混搭(方案 D 用阿里一个 Key 跑双端)。
- **方案 G** 或 **方案 I** —— 保留 Codex 作为执行者,只换审稿人(Claude 或 Gemini)。
- **方案 H** —— 用 Antigravity 作为执行器(Claude Opus 4.6 或 Gemini 3.1 Pro),GPT-5.4 或任意 `llm-chat` 审稿。
\* 方案 G 通常依赖本地 Codex CLI 和 Claude Code CLI 的登录态;不强制要求 API key。
展开方案 C/D/E/G/H/I 的提供商细节
**方案 C** 已适配的提供商:GLM(Z.ai)、Kimi(Moonshot)、LongCat(美团)作为执行器;DeepSeek、MiniMax 作为审查器。任何 OpenAI 兼容 API 理论上均可通过通用 [`llm-chat`](mcp-servers/llm-chat/) MCP 服务器接入。
**方案 D** 使用[阿里百炼 Coding Plan](https://bailian.console.aliyun.com/)——一个 API Key 包含 4 款模型(Kimi、Qwen、GLM、MiniMax),双端点配置。
**方案 E** 使用 [ModelScope(魔搭社区)](https://www.modelscope.cn/)——**免费**(2000 次/天),一个 Key,无自动化限制。
**方案 G** 保持 Codex 作为执行者,但把审稿人切换成通过本地 `claude-review` MCP bridge 暴露出来的 Claude Code CLI,并用异步轮询处理长论文 / 长 review prompt。
**方案 H** 使用 [Google Antigravity](https://antigravity.google/) 作为执行器,原生支持 SKILL.md——可选 Claude Opus 4.6(Thinking)或 Gemini 3.1 Pro(high)作为执行模型。
**方案 I** 保持 Codex 作为执行者,只增加一层很薄的 `skills-codex-gemini-review` overlay,并通过本地 `gemini-review` MCP bridge 把 reviewer-aware 预定义 skills 默认接到 direct Gemini API。这是与现有 Codex+Claude 审稿路径最接近的 Gemini 版本,同时 skill 改动最少,而且连 poster PNG 审查也复用了同一个 bridge。免费层可用性、限速和数据处理条款仍以 Google 当前政策为准。
### 方案 A: GLM + GPT
只替换执行者(Claude → 通过 Z.ai 切到 GLM),保留 GPT-5.4 通过 Codex MCP 审稿。Codex CLI 复用你已有的 `OPENAI_API_KEY`(来自 `~/.codex/config.toml` 或环境变量),审稿端不需要额外配置。
展开方案 A 的安装命令与 ~/.claude/settings.json
```bash
npm install -g @anthropic-ai/claude-code
npm install -g @openai/codex
codex setup # 提示选模型时选 gpt-5.5
```
配置 `~/.claude/settings.json`:
```json
{
"env": {
"ANTHROPIC_AUTH_TOKEN": "your_zai_api_key",
"ANTHROPIC_BASE_URL": "https://api.z.ai/api/anthropic",
"API_TIMEOUT_MS": "3000000",
"ANTHROPIC_DEFAULT_HAIKU_MODEL": "glm-4.5-air",
"ANTHROPIC_DEFAULT_SONNET_MODEL": "glm-4.7",
"ANTHROPIC_DEFAULT_OPUS_MODEL": "glm-5"
},
"mcpServers": {
"codex": {
"command": "/opt/homebrew/bin/codex",
"args": ["mcp-server"]
}
}
}
```
### 方案 B: GLM + MiniMax
无需 Claude 或 OpenAI API。使用自定义 MiniMax MCP 服务器替代 Codex(因为 MiniMax 不支持 OpenAI 的 Responses API)。完整指南:[`docs/MINIMAX_MCP_GUIDE.md`](docs/MINIMAX_MCP_GUIDE.md)。
### 方案 C: 任意执行者 + 任意审稿人
通过通用 `llm-chat` MCP 服务器自由混搭,支持任意 OpenAI 兼容 API 作为审稿人。完整指南:[`docs/LLM_API_MIX_MATCH_GUIDE.md`](docs/LLM_API_MIX_MATCH_GUIDE.md)。
示例组合:GLM + DeepSeek、Kimi + MiniMax、Claude + DeepSeek、LongCat + GLM 等。
### 配置完成后:安装 Skills 并验证
推荐用上面 [§ 安装 Skills](#安装-skills) 的项目级 symlink 安装——所有方案通用。下面的全局拷贝是 fallback,如果你更习惯把所有 skill 放到 `~/.claude/skills/` 也行。
展开全局拷贝 fallback 安装命令与非 Claude 执行者的验证 prompt
```bash
git clone https://github.com/wanshuiyin/Auto-claude-code-research-in-sleep.git
cd Auto-claude-code-research-in-sleep
cp -r skills/* ~/.claude/skills/
claude
```
> **⚠️ 非 Claude 执行者(GLM、Kimi 等):** 需要让模型先读一遍项目,确保 skill 能正确解析。尤其是当你已经[改写了 skill](#-替代模型组合)以使用不同的审查器 MCP(如 `mcp__llm-chat__chat` 替代 `mcp__codex__codex`)时——新执行器需要理解变更后的工具调用方式:
>
> ```
> 读一下这个项目,验证所有 skills 是否正常:
> /idea-creator, /research-review, /auto-review-loop, /novelty-check,
> /idea-discovery, /research-pipeline, /research-lit, /run-experiment,
> /analyze-results, /monitor-experiment, /pixel-art
> ```
> ⚠️ **注意:** 替代模型的行为可能与 Claude 和 GPT-5.4 有所不同。你可能需要微调 prompt 模板以获得最佳效果。核心的跨模型架构不变。
## 💬 交流群
**欢迎贡献领域专用 skill!** 核心 skills 覆盖通用科研工作流,但每个领域都有自己的工具和范式。欢迎提交 PR 为你的领域添加新 skill——EDA、生物信息学、机器人、HPC 等等。只需添加一个 `skills/your-skill/SKILL.md` 并开 PR 即可。参考 [`dse-loop`](skills/dse-loop/SKILL.md) 作为示例。
欢迎加入微信群,交流 Claude Code + AI 科研工作流:
## 📖 引用
如果 ARIS 对你的研究有帮助,请引用:
```bibtex
@article{yang2026aris,
title={ARIS: Autonomous Research via Adversarial Multi-Agent Collaboration},
author={Yang, Ruofeng and Li, Yongcan and Li, Shuai},
journal={arXiv preprint arXiv:2605.03042},
year={2026}
}
```
## ⭐ Star History

[](https://star-history.com/#wanshuiyin/Auto-claude-code-research-in-sleep&Date)
## 🙏 致谢
**灵感来自** — 🧪 [AI Scientist](https://github.com/SakanaAI/AI-Scientist)(Sakana)· 📖 [AutoResearch](https://github.com/karpathy/autoresearch)(Karpathy)· 🔭 [FARS](https://analemma.ai/blog/introducing-fars/)(Analemma)· 🎨 [PaperBanana](https://github.com/dwzhu-pku/PaperBanana)(PKU)。
**核心基础设施** — [Claude Code](https://docs.anthropic.com/en/docs/claude-code)(执行层骨干)· [Codex CLI](https://github.com/openai/codex)(通过 MCP 实现跨模型审稿)。
**集成** — **Zotero**([指南](docs/integrations/ZOTERO_CN.md)):[zotero-mcp](https://github.com/54yyyu/zotero-mcp)、[Zotero](https://www.zotero.org/)。**Obsidian**([指南](docs/integrations/OBSIDIAN_CN.md)):[mcpvault](https://github.com/bitbonsai/mcpvault)、[obsidian-skills](https://github.com/kepano/obsidian-skills)(Obsidian CEO [Steph Ango](https://github.com/kepano) 维护)。**飞书/Lark**([指南](docs/integrations/FEISHU_CN.md)):[feishu-claude-code](https://github.com/joewongjc/feishu-claude-code)、[clawdbot-feishu](https://github.com/m1heng/clawdbot-feishu)、[cc-connect](https://github.com/chenhg5/cc-connect)、[lark-openapi-mcp](https://github.com/larksuite/lark-openapi-mcp)。
**论文写作灵感** — [claude-scholar](https://github.com/Galaxy-Dawn/claude-scholar) · [Research-Paper-Writing-Skills](https://github.com/Master-cai/Research-Paper-Writing-Skills) · [baoyu-skills](https://github.com/jimliu/baoyu-skills)。**社区** — [awesome-agent-skills](https://github.com/VoltAgent/awesome-agent-skills)(已收录)。
**平台适配** — 🤖 [@Falling-Flower](https://github.com/Falling-Flower)(Codex CLI 适配 via `spawn_agent`)· 🔧 [@No-518](https://github.com/No-518)(Codex skill 维护)· 🖱️ [@YecanLee](https://github.com/YecanLee)([Cursor 适配指南](docs/CURSOR_ADAPTATION.md) + 本地 GPU 文档)· 🏆 [@DefanXue](https://github.com/DefanXue) & [@Monglitay](https://github.com/Monglitay)(首个 ARIS 全流程社区论文,CS 会议评分 8/10)。
**架构与愿景** — 💡 [@JingxuanKang](https://github.com/JingxuanKang):不止于代码贡献(training-check、result-to-claim、ablation-planner、watchdog、模板、session 恢复),更深度参与 ARIS 架构讨论——compact 模式、工作流状态管理、自主科研愿景——今天很多核心功能(结构化项目文件、context-aware session 恢复)都源自这些对话。
## License
MIT