# audio_ai_agent
**Repository Path**: harry_zing/audio_ai_agent
## Basic Information
- **Project Name**: audio_ai_agent
- **Description**: 音频专用代理人仓库(存放AI提示词)
- **Primary Language**: Unknown
- **License**: Not specified
- **Default Branch**: main
- **Homepage**: None
- **GVP Project**: No
## Statistics
- **Stars**: 0
- **Forks**: 0
- **Created**: 2026-01-09
- **Last Updated**: 2026-05-05
## Categories & Tags
**Categories**: Uncategorized
**Tags**: None
## README
# ~~从软件工程师到提示词工程师~~ ~~步坦~~ 碳硅协同!
# 前言-关于AI
## 关于模型
提到AI,就不得不提 **模型** 。在我看来,从程序员的角度来说,模型就是一个超大规模的 **函数/方法**。一旦模型被训练完成并部署上线,它的行为就类似于一个“黑盒”函数被“固定”:给定输入,它会根据内部参数生成对应的输出。
需要注意的是:在正常情况下,AI模型本身不具备记忆能力,每次新开聊天时不会主动保留或访问你之前的对话记录。
但是呢, **服务系统(Service Backend)** 可能会记录你的对话日志,用于:
* 安全审核(如检测违法内容)
* 模型训练(部分平台会匿名化使用)
* 用户行为分析(比如我被“通报表扬”):
### 模型重要参数-token
反正用内部部署模型不要钱,无所谓了,有想了解的自己去搜一下
### 模型重要参数-总参数量
参数量越大,通常表示模型容量越大,理论上能记住更多知识、处理更复杂任务。
### 模型重要参数-上下文长度
* **什么是上下文(Context)**:上下文 指的是模型在生成或理解一段文本时,所能“看到”或“记住”的前面输入内容的范围。它决定了模型可以依赖多少历史信息来进行当前的推理或生成。
* **上下文长度**:决定了模型能处理的最长文本(输入 + 输出)
**类比理解**
你可以把“上下文”想象成一个人的记忆长度:
* 如果一个人只能记住最近几句话,他就容易忘记对话开头说了什么(短上下文)。
* 如果他能记住整场对话甚至之前的几场对话,他就能更连贯地回应(长上下文)。
AI 模型也一样,它的“记忆力”受限于上下文长度。
## 模型区别
说啥都不如自己体验,先看看这个图:

作为参考,内网AI的模型ID是 `Qwen3-235B-FP8`
[这是链接,自己去康康~](https://cloud.siliconflow.cn/i/yRzR4fWP)
## 模型调用工具(后面简称工具)
目前Lango的工具,能用的是以下3种:
1. VSCode插件 `CLINE`
2. VSCode插件 `GitHub Copilot`
3. VSCode高仿编辑器 `void`
其实还有一个
* VSCode插件 `Continue`
以下是他们之间的差别
| 工具名称 | 类型 | 所属平台 | 备注 |
| :------------: | :----------------: | :------------------: | -------------------------------------------------------------------------- |
| CLINE | VSCode 插件 | / | 调用内部大模型较慢,已建议弃用 |
| GitHub Copilot | VSCode 插件 | GitHub | 支持代码补全、函数生成,集成度高,响应快(***不支持调用内部模型***) |
| void | 高仿 VSCode 编辑器 | 独立应用 | 内置模型调用能力,适合轻量级使用,但生态较弱(**支持调用内部模型**) |
| Continue | VSCode 插件 | 开源(continue.dev) | 支持自定义模型(如 GPT、Claude、本地模型),配置灵活(**支持调用内部模型**) |
我就比较习惯用 `Continue` ,后续也将以这个作为模板进行示例。
### 模式
最开始的时候,模型基本只能使用 `Chat` 模式,用户提问,模型回答 。后来经过拓展、迭代,在 `Continue` 中,已经有以下功能:
| 模式 | 作用 | 使用场景 | 特点 |
| :----------: | ------------------------------------------------------------------- | ---------------------------------------------------------------------------- | ------------------------------------------------------------------------------------------------ |
| `Chat` | 进行基础对话,获取代码解释、建议或回答技术问题 | - 询问代码含义
- 学习 API 用法
- 调试思路咨询 | - 即问即答
- 不自动修改代码
- 类似 ChatGPT,交互最轻量 |
| `Plan` | 让 AI 先制定任务执行步骤,生成清晰的行动计划,等待用户确认后执行 | - 添加新功能(如“添加用户登录接口”)
- 重构模块
- 迁移代码库 | - 分步规划(如修改哪些文件、添加什么逻辑)
- 用户可审阅、编辑计划
- 安全可控,适合复杂任务 |
| `Agent` | AI 作为自主代理,自动执行多步骤任务,包括修改文件、运行命令、测试等 | - 自动实现功能
- 批量重构
- 修复 bug 并验证 | - 全自动执行
- 可调用编辑器、终端、测试工具
- 高效但需谨慎使用 |
| `Background` | 在后台持续运行,监听上下文或执行长期辅助任务,不打断当前工作流 | - 自动记录开发日志
- 监控代码变更并提供建议
- 持续优化提示词或配置文件 | - 无感辅助
- 支持长期运行
- 功能依赖插件或自定义配置,目前仍在演进中 |
[Continue官方Agent文档(Cuntinue的Agent快速入门)](https://docs.continue.dev/ide-extensions/agent/quick-start)
**GitHub Copilot也差不多是这几个模式,有兴趣可以自己了解**
**(当前内网模型貌似不支持 Background 模式2333333)**
### markdown
markdown简称md,后缀也是 `.md` ,是专属于程序员的word格式!跟AI交流,使用markdown格式可以事半功倍!AI给你的回答,基本也是使用的md格式~
在VSCode中,可以直接点击右上角的 `打开预览` 来直观看到效果。
[30分钟入个门就好,点我进入菜鸡世界!](https://www.runoob.com/markdown/md-tutorial.html)(最原始最基础的markdown语法)
或者:
[在有道云中使用.md](https://note.youdao.com/help-center/advance_markdown.html)(可能会有进阶语法或非标语法)
## 提示词
在前文 [关于模型](#关于模型) 中已经详细说明了 [上下文长度](#模型重要参数-上下文长度) 会限制模型所能“记住”的前面输入内容的范围。
那么,在实际使用中,总是会出现“一次对话中,多轮对话才能产生可用消息/结果”,当多轮对话时,可能会出现胡言乱语、重复、自相矛盾,甚至编造信息(这个也跟模型本身调参有关,此处不展开),当你在这个领域不够熟悉时,这吊毛就会坑你了!!!
所以,在预见到一次可能完不成你的目标时,将问答获取的有效信息整理为md,将其作为提示词,可以高效的推进你的问题
## AI Agent
好了,总算说到重点了。来说说AI Agent。
从前文的 [AI工具的模式说明](#模式) 和 [提示词](#提示词) 可以看出来,简单的说, **“AI Agent”** 就是一个Chat+工具集(目前来看,就是AI可以帮你直接在命令行执行很多指令,但是对程序猿来说,执行指令就可以完成所有事了不是吗!)
看看Continue对`Agent`的描述:
![AI Agent本质]()
# 工具选择
经过上面的说明,你应该已经了解模型的区别,以及模型工具的区别。
(还是建议放弃使用cline和void,跟Copilot和Continue用户量都不是一个量级的,Copilot要是能用内网ai我也用Copilot了~)
(要是Copilot支持内网模型就好了。。作为背后有金主自己有大模型的工具,优势还是太大了。。)
但我,就使用 `Continue` !!!(蚌埠脸)
所以这里也只介绍 `Continue` 的使用,你也可以用 `Copilot` 相关理念和使用方法大同小异哈~
## **Continue**
[Continue的官方文档](https://docs.continue.dev/)
[Continue配置文件的官方文档](https://docs.continue.dev/reference)
## 安装Continue
**在线安装:略**
**离线安装:**
[continue的vsix文件](doc/VSIX/continue.continue-1.2.11-win32-x64.vsix)
离线安装插件:

## 配置内部AI模型
1. 点击插件右上角齿轮(open Setting)
2. 点击左边 `Configs`
3. 点击 `Local Config` 右边的齿轮
4. 打开的文件为 **Continue的全局配置文件** ,替换为如下信息
```yaml
name: Local Config
version: 1.0.0
schema: v1
# 原有的模型配置
models:
- name: LangoQwen3
provider: openai
apiBase: http://115.190.54.79:8000/v1
apiKey: zengying # 👈 替换为你的姓名拼音
model: Qwen3-235B-FP8
```
5. 此时可以测试内部AI使用情况
图示安装步骤:
步骤1:

步骤2:

完成上述步骤,保存文件并返回到主界面后即可开始使用!

## 关于提示词文件
copilot和continue的提示词文件都有“全局”和“当前路径”的区别。从名称上也能分辨区别,“全局”是全局生效的,“当前路径”只有当前工作目录生效。
例如:
* 全局路径`C:\Users\[YourUserName]\.continue\rules\global-rule.md`
* 项目路径`D:\WorkLango\Program\MiddleWare3.0\.continue\rules\BUG_639851-prompt.md`
[官方对于全局和local的说明](https://docs.continue.dev/customize/deep-dives/rules):

(上述链接同样有的说明:)

与copilot不同的是,continue仅有 `Rules` 和 `Prompts` 两种类型的提示词文件。
但其实本质都是 **.md格式的提示词**!!!
所以仅在用法上有区别:
1. `Rules` 类型文件用于定义规则。例如:C语言代码的格式,java代码的格式(这种就可以使用全局生效的规则,需要使用时再打开/关闭)。中间件的编码规则、代码结构等,就可以放在对应的项目目录下,仅当前项目生效。
2. `Prompts` 类型文件就是我们主要用到的AI Agent了。添加文件后就可以在聊天中按 `/` 键引用了!
而 `Rules` 需要在配置里面开关(以决定当前会话是否使用),如下图:

## 关于提示词工程
提示词的作用是 ***约束*** AI进行工作。
描述比执行更重要:
当我们使用Copilot、Cursor或ChatGPT时,最常见的模式是将其视为一个“更聪明的搜索引擎”——输入模糊的指令,得到需要反复修正的结果。
但AI本质上是一位能力强大但需要明确指令的同事。与人类同事协作时,我们会自然地将任务背景、具体要求、验收标准说清楚。与AI协作时,我们却常常省略这些关键信息!
# 开始与AI Agent协同!
~~现在,你已经是一个合格的提示词工程师了!开始与AI agent协作吧!!!~~
开个玩笑,提示词的构建任重而道远,但是好歹起步了不是?
[continue官方关于Prompts的md文件说明](https://docs.continue.dev/customize/deep-dives/prompts)
## 官方文档搬运
### invokable
将 `invokable` 设置为 `true`,你会将 markdown 文件变成提示,输入 `/` 聊天、计划和代理模式时会显示。
```md
---
name: Explain invokable
description: Explains what happens when you set invokable to true
invokable: true
---
Explain that when `invokable` is set to `true`, a slash command becomes available in the IDE extensions and CLI
```
这些斜杠命令可以与其他指令(包括高亮代码)结合使用,以提供额外的上下文。