主题
模型
海慧智擎背后是一组可切换的大模型。默认配置开箱即用,你通常不用管模型也能把活干完;当某项任务对"上下文长度"或"响应速度"有特别要求时,再用 /model 切一下即可。
本页讲清三件事:有哪些模型、/model 怎么切、不同模型分别适合什么场景。
可用模型
出厂默认提供以下模型,以默认主力为首选:
| 模型 | 单次上下文 | 定位 |
|---|---|---|
deepseek-v4-pro | 约 100 万 token | 默认主力,能力最全,适合绝大多数任务 |
qwen37plus | 约 100 万 token | 大上下文备选,适合长材料处理 |
qwen36-35A3B | 256K token | 响应轻快,适合中短材料的快速处理 |
不确定选哪个?
保持默认的 deepseek-v4-pro 就好。它上下文最长、能力最全,合同审查、台账汇总、标书响应这类日常事务都能稳稳接住。先把活交给默认模型,等遇到具体瓶颈再考虑切换。
上表是出厂标准清单。具体可用的模型由服务方(贵司管理员)统一配置,可能与上表略有出入——以你机器上
/model菜单里实际列出的为准。
用 /model 切换
在交互界面里输入 /model,有三种用法:
text
/modeltext
/model qwen36-35A3Btext
/model status/model(不带参数):弹出模型选择菜单,用方向键选、回车确认,切换即时生效;/model [模型名]:跳过菜单,直接切到指定模型;/model status:不切换,只显示当前正在用的模型。
切换后界面会提示 已切换至 …,本次会话后续的对话都用新模型。下次启动时沿用你上次选的模型,不会被重置。
计划模式下的临时模型
若你在某些场景为「计划模式(Plan Mode)」单独指定了模型,/model 会同时显示当前模型与基础模型两行,让你看清此刻生效的到底是哪个。
上下文长度是什么
上下文(context) 是模型单次"能看到"的全部内容——本次会话的对话历史,以及你引用进来的文件和图片,合在一起算。上下文长度(如「100 万 token」)就是这一整包内容的容量上限。
它直接决定一个很实际的问题:一次能塞进去多少材料。
- 约 100 万 token:足以一次通读上百页的合同、台账或标书,无需拆分;
- 256K token:适合中短篇材料——几十页的文档、单份合同、一沓报销单。
上下文会累积,越长越慢
上一轮读进来的合同、之前的对话、生成的修订稿,下一轮提问时会一起再发一遍。所以即便模型上下文很大,把无关旧内容长期留在会话里仍会拖慢速度。
会话变长、变慢时:开新活用 /clear 清空,接着干用 /compact 压缩。详见上下文与引用。
不同模型适合什么场景
模型的取舍主要在上下文长度和响应速度之间:材料越长越需要大上下文,任务越轻越能用快速档提速。
| 场景 | 建议模型 | 为什么 |
|---|---|---|
| 通读百页合同 / 台账 / 标书 | deepseek-v4-pro(默认) | 上下文最长,整份材料一次读尽不拆分 |
| 按红线逐条核验合同、出修订稿 | deepseek-v4-pro(默认) | 长材料 + 核验对能力要求高,默认主力最稳 |
| 同样需要大上下文的备选 | qwen37plus | 百万级上下文,处理长材料的另一选择 |
| 中短文档快速提炼、改写 | qwen36-35A3B | 材料不长,响应轻快、出活更快 |
一个简单的判断法
材料长、要审要核 → 默认主力;材料短、图省事 → 换快速的。拿不准时,默认主力永远是安全选项。
模型清单如何更新
你不需要手动维护模型列表:
- 可用模型与对应上下文长度由服务方统一配置,对你免维护;
- 升级到新版本后第一次打开,海慧智擎会自动对齐到最新的模型清单——服务方调整了可用模型,所有客户更新后自动同步;
- 这个过程会保留你已选的模型和 API Key,不会把你切回默认。
因此,若某次更新后
/model菜单里的模型有了变化,是正常的——以菜单实际列出的为准即可。
在哪里改
模型是面向用户仅有的两项可改配置之一(另一项是 API Key),写在 ~/.hi/settings.json。日常直接用 /model 切换就好,无需手动编辑文件。关于配置文件本身,见常见问题。