CowAgent 支持国内外主流厂商的大语言模型,模型接口实现在项目的 models/ 目录下。除文本对话外,部分厂商还提供视觉理解、图像生成、语音识别、语音合成、向量等能力,可在 Agent 流程中按需调用。
模型能力总览
各厂商提供的能力一览。「文本」指主对话模型,其余列表示该厂商可承担对应 Agent 能力。
| 厂商 | 代表模型 | 文本 | 图像理解 | 图像生成 | 语音识别 | 语音合成 | 向量 |
|---|
| DeepSeek | deepseek-v4-flash / pro | ✅ | | | | | |
| MiniMax | MiniMax-M3 | ✅ | ✅ | ✅ | | ✅ | |
| Claude | claude-opus-4-8 | ✅ | ✅ | | | | |
| Gemini | gemini-3.5-flash | ✅ | ✅ | ✅ | | | |
| OpenAI | gpt-5.5、o 系列 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 智谱 GLM | glm-5.1、glm-5v-turbo | ✅ | ✅ | | ✅ | | ✅ |
| 通义千问 | qwen3.7-plus | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 豆包 Doubao | doubao-seed-2.0 系列 | ✅ | ✅ | ✅ | | | ✅ |
| Kimi | kimi-k2.6 | ✅ | ✅ | | | | |
| 百度千帆 | ernie-5.1 | ✅ | ✅ | | | | |
| 小米 MiMo | mimo-v2.5-pro / v2.5 | ✅ | ✅ | | | ✅ | |
| LinkAI | 多厂商 100+ 模型统一接入 | ✅ | ✅ | ✅ | ✅ | ✅ | ✅ |
| 自定义 | 本地模型 / 三方代理 | ✅ | | | | | |
Web 控制台中各项能力(视觉 / 图像 / 语音识别 / 语音合成 / 向量 / 网络搜索)均可独立配置厂商与模型,互相之间不强制绑定。
配置方式
方式一(推荐): 通过 Web 控制台 在线管理模型与各项能力,无需手动编辑配置文件:
方式二: 手动编辑 config.json,根据所选模型填写对应的模型名称和 API Key。每个模型也支持 OpenAI 兼容方式接入,将 bot_type 设为 openai,配置 open_ai_api_base 和 open_ai_api_key 即可。