# audio_ai_agent

**Repository Path**: harry_zing/audio_ai_agent

## Basic Information

- **Project Name**: audio_ai_agent
- **Description**: 音频专用代理人仓库（存放AI提示词）
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-01-09
- **Last Updated**: 2026-05-05

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# ~~从软件工程师到提示词工程师~~ ~~步坦~~ 碳硅协同！

# 前言-关于AI
## 关于模型
提到AI，就不得不提 **模型** 。在我看来，从程序员的角度来说，模型就是一个超大规模的 **函数/方法**。一旦模型被训练完成并部署上线，它的行为就类似于一个“黑盒”函数被“固定”：给定输入，它会根据内部参数生成对应的输出。

需要注意的是：在正常情况下，AI模型本身不具备记忆能力，每次新开聊天时不会主动保留或访问你之前的对话记录。
但是呢， **服务系统（Service Backend）** 可能会记录你的对话日志，用于：
* 安全审核（如检测违法内容）
* 模型训练（部分平台会匿名化使用）
* 用户行为分析（比如我被“通报表扬”）：![被“通报表扬”](doc/pic/使用AI被“通报表扬”.png)

### 模型重要参数-token
反正用内部部署模型不要钱，无所谓了，有想了解的自己去搜一下

### 模型重要参数-总参数量
参数量越大，通常表示模型容量越大，理论上能记住更多知识、处理更复杂任务。

### 模型重要参数-上下文长度
* **什么是上下文（Context）**：上下文 指的是模型在生成或理解一段文本时，所能“看到”或“记住”的前面输入内容的范围。它决定了模型可以依赖多少历史信息来进行当前的推理或生成。
* **上下文长度**：决定了模型能处理的最长文本（输入 + 输出）

**类比理解**  
你可以把“上下文”想象成一个人的记忆长度：
* 如果一个人只能记住最近几句话，他就容易忘记对话开头说了什么（短上下文）。
* 如果他能记住整场对话甚至之前的几场对话，他就能更连贯地回应（长上下文）。
AI 模型也一样，它的“记忆力”受限于上下文长度。


## 模型区别
说啥都不如自己体验，先看看这个图：
![硅基流动-部分模型](doc/pic/硅基流动-部分模型.png)

作为参考，内网AI的模型ID是 `Qwen3-235B-FP8`

[这是链接，自己去康康~](https://cloud.siliconflow.cn/i/yRzR4fWP)

## 模型调用工具（后面简称工具）
目前Lango的工具，能用的是以下3种：
1. VSCode插件 `CLINE`
2. VSCode插件 `GitHub Copilot`
3. VSCode高仿编辑器 `void`

其实还有一个  
* VSCode插件 `Continue` 

以下是他们之间的差别

|    工具名称    |        类型        |       所属平台       | 备注                                                                       |
| :------------: | :----------------: | :------------------: | -------------------------------------------------------------------------- |
|     CLINE      |    VSCode 插件     |          /           | 调用内部大模型较慢，已建议弃用                                             |
| GitHub Copilot |    VSCode 插件     |        GitHub        | 支持代码补全、函数生成，集成度高，响应快(***不支持调用内部模型***)         |
|      void      | 高仿 VSCode 编辑器 |       独立应用       | 内置模型调用能力，适合轻量级使用，但生态较弱(**支持调用内部模型**)         |
|    Continue    |    VSCode 插件     | 开源（continue.dev） | 支持自定义模型（如 GPT、Claude、本地模型），配置灵活(**支持调用内部模型**) |

我就比较习惯用 `Continue` ，后续也将以这个作为模板进行示例。

### 模式
最开始的时候，模型基本只能使用 `Chat` 模式，用户提问，模型回答 。后来经过拓展、迭代，在  `Continue` 中，已经有以下功能：

|     模式     | 作用                                                                | 使用场景                                                                     | 特点                                                                                             |
| :----------: | ------------------------------------------------------------------- | ---------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------ |
|    `Chat`    | 进行基础对话，获取代码解释、建议或回答技术问题                      | - 询问代码含义<br>- 学习 API 用法<br>- 调试思路咨询                          | - 即问即答<br>- 不自动修改代码<br>- 类似 ChatGPT，交互最轻量                                     |
|    `Plan`    | 让 AI 先制定任务执行步骤，生成清晰的行动计划，等待用户确认后执行    | - 添加新功能（如“添加用户登录接口”）<br>- 重构模块<br>- 迁移代码库           | - 分步规划（如修改哪些文件、添加什么逻辑）<br>- 用户可审阅、编辑计划<br>- 安全可控，适合复杂任务 |
|   `Agent`    | AI 作为自主代理，自动执行多步骤任务，包括修改文件、运行命令、测试等 | - 自动实现功能<br>- 批量重构<br>- 修复 bug 并验证                            | - 全自动执行<br>- 可调用编辑器、终端、测试工具<br>- 高效但需谨慎使用                             |
| `Background` | 在后台持续运行，监听上下文或执行长期辅助任务，不打断当前工作流      | - 自动记录开发日志<br>- 监控代码变更并提供建议<br>- 持续优化提示词或配置文件 | - 无感辅助<br>- 支持长期运行<br>- 功能依赖插件或自定义配置，目前仍在演进中                       |

[Continue官方Agent文档（Cuntinue的Agent快速入门）](https://docs.continue.dev/ide-extensions/agent/quick-start)  
**GitHub Copilot也差不多是这几个模式，有兴趣可以自己了解**  
**（当前内网模型貌似不支持 Background 模式2333333）**

### markdown
markdown简称md，后缀也是 `.md` ，是专属于程序员的word格式！跟AI交流，使用markdown格式可以事半功倍！AI给你的回答，基本也是使用的md格式~  
在VSCode中，可以直接点击右上角的 `打开预览` 来直观看到效果。  
[30分钟入个门就好，点我进入菜鸡世界！](https://www.runoob.com/markdown/md-tutorial.html)（最原始最基础的markdown语法）  
或者：  
[在有道云中使用.md](https://note.youdao.com/help-center/advance_markdown.html)（可能会有进阶语法或非标语法）  

## 提示词
在前文 [关于模型](#关于模型) 中已经详细说明了 [上下文长度](#模型重要参数-上下文长度)  会限制模型所能“记住”的前面输入内容的范围。  
那么，在实际使用中，总是会出现“一次对话中，多轮对话才能产生可用消息/结果”，当多轮对话时，可能会出现胡言乱语、重复、自相矛盾，甚至编造信息（这个也跟模型本身调参有关，此处不展开），当你在这个领域不够熟悉时，这吊毛就会坑你了！！！  
所以，在预见到一次可能完不成你的目标时，将问答获取的有效信息整理为md，将其作为提示词，可以高效的推进你的问题

## AI Agent
好了，总算说到重点了。来说说AI Agent。  
从前文的 [AI工具的模式说明](#模式) 和 [提示词](#提示词) 可以看出来，简单的说， **“AI Agent”** 就是一个Chat+工具集（目前来看，就是AI可以帮你直接在命令行执行很多指令，但是对程序猿来说，执行指令就可以完成所有事了不是吗！）  
看看Continue对`Agent`的描述：  
![AI Agent本质](<doc/pic/AI Agent本质.png>)

# 工具选择
经过上面的说明，你应该已经了解模型的区别，以及模型工具的区别。  
（还是建议放弃使用cline和void，跟Copilot和Continue用户量都不是一个量级的，Copilot要是能用内网ai我也用Copilot了~）  
（要是Copilot支持内网模型就好了。。作为背后有金主自己有大模型的工具，优势还是太大了。。）
但我，就使用 `Continue` ！！！（蚌埠脸）  
所以这里也只介绍 `Continue` 的使用，你也可以用 `Copilot` 相关理念和使用方法大同小异哈~

## **Continue**

[Continue的官方文档](https://docs.continue.dev/)  
[Continue配置文件的官方文档](https://docs.continue.dev/reference)

## 安装Continue
**在线安装：略**  
**离线安装：**  
[continue的vsix文件](doc/VSIX/continue.continue-1.2.11-win32-x64.vsix)  
离线安装插件：  
![离线安装插件](doc/pic/离线安装插件.png)

## 配置内部AI模型
1. 点击插件右上角齿轮（open Setting）
2. 点击左边 `Configs`
3. 点击 `Local Config` 右边的齿轮
4. 打开的文件为 **Continue的全局配置文件** ，替换为如下信息
```yaml
name: Local Config
version: 1.0.0
schema: v1

# 原有的模型配置
models:
  - name: LangoQwen3
    provider: openai
    apiBase: http://115.190.54.79:8000/v1
    apiKey: zengying  # 👈 替换为你的姓名拼音
    model: Qwen3-235B-FP8
```
5. 此时可以测试内部AI使用情况

图示安装步骤：  
步骤1：  
![1-Continue配置步骤](doc/pic/1-Continue配置步骤.png)  
步骤2:  
![2-Continue配置步骤](doc/pic/2-Continue配置步骤.png)  
完成上述步骤，保存文件并返回到主界面后即可开始使用！  
![返回到主界面](doc/pic/返回到主界面.png)  


## 关于提示词文件
copilot和continue的提示词文件都有“全局”和“当前路径”的区别。从名称上也能分辨区别，“全局”是全局生效的，“当前路径”只有当前工作目录生效。
例如：
* 全局路径`C:\Users\[YourUserName]\.continue\rules\global-rule.md`
* 项目路径`D:\WorkLango\Program\MiddleWare3.0\.continue\rules\BUG_639851-prompt.md`  
[官方对于全局和local的说明](https://docs.continue.dev/customize/deep-dives/rules):  
![官方对于全局和local的说明（图片）](doc/pic/Continue对于全局和local的说明.png)  
（上述链接同样有的说明：）  
![ContinueRule字段描述](doc/pic/ContinueRule字段描述.png)

与copilot不同的是，continue仅有 `Rules` 和 `Prompts` 两种类型的提示词文件。
但其实本质都是 **.md格式的提示词**！！！
所以仅在用法上有区别：
1. `Rules` 类型文件用于定义规则。例如：C语言代码的格式，java代码的格式（这种就可以使用全局生效的规则，需要使用时再打开/关闭）。中间件的编码规则、代码结构等，就可以放在对应的项目目录下，仅当前项目生效。
2. `Prompts` 类型文件就是我们主要用到的AI Agent了。添加文件后就可以在聊天中按 `/` 键引用了！  

而 `Rules` 需要在配置里面开关（以决定当前会话是否使用），如下图：  
![Ruler的使用](doc/pic/Ruler的使用.png)  

## 关于提示词工程
提示词的作用是 ***约束*** AI进行工作。  
描述比执行更重要：  
当我们使用Copilot、Cursor或ChatGPT时，最常见的模式是将其视为一个“更聪明的搜索引擎”——输入模糊的指令，得到需要反复修正的结果。
但AI本质上是一位能力强大但需要明确指令的同事。与人类同事协作时，我们会自然地将任务背景、具体要求、验收标准说清楚。与AI协作时，我们却常常省略这些关键信息！

# 开始与AI Agent协同！
~~现在，你已经是一个合格的提示词工程师了！开始与AI agent协作吧！！！~~  
开个玩笑，提示词的构建任重而道远，但是好歹起步了不是？  

[continue官方关于Prompts的md文件说明](https://docs.continue.dev/customize/deep-dives/prompts)

## 官方文档搬运
### invokable
将 `invokable` 设置为 `true`，你会将 markdown 文件变成提示，输入 `/` 聊天、计划和代理模式时会显示。
```md
---
name: Explain invokable
description: Explains what happens when you set invokable to true
invokable: true
---

Explain that when `invokable` is set to `true`, a slash command becomes available in the IDE extensions and CLI
```
这些斜杠命令可以与其他指令（包括高亮代码）结合使用，以提供额外的上下文。