模型

海慧智擎背后是一组可切换的大模型。默认配置开箱即用，你通常不用管模型也能把活干完；当某项任务对"上下文长度"或"响应速度"有特别要求时，再用 /model 切一下即可。

本页讲清三件事：有哪些模型、/model 怎么切、不同模型分别适合什么场景。

可用模型

出厂默认提供以下模型，以默认主力为首选：

模型	单次上下文	定位
`deepseek-v4-pro`	约 100 万 token	默认主力，能力最全，适合绝大多数任务
`qwen37plus`	约 100 万 token	大上下文备选，适合长材料处理
`qwen36-35A3B`	256K token	响应轻快，适合中短材料的快速处理

不确定选哪个？

保持默认的 deepseek-v4-pro 就好。它上下文最长、能力最全，合同审查、台账汇总、标书响应这类日常事务都能稳稳接住。先把活交给默认模型，等遇到具体瓶颈再考虑切换。

上表是出厂标准清单。具体可用的模型由服务方（贵司管理员）统一配置，可能与上表略有出入——以你机器上 /model 菜单里实际列出的为准。

用 /model 切换

在交互界面里输入 /model，有三种用法：

打开菜单选直接切到指定模型只看当前用的是哪个

text

/model

text

/model qwen36-35A3B

text

/model status

/model（不带参数）：弹出模型选择菜单，用方向键选、回车确认，切换即时生效；
/model [模型名]：跳过菜单，直接切到指定模型；
/model status：不切换，只显示当前正在用的模型。

切换后界面会提示 已切换至 …，本次会话后续的对话都用新模型。下次启动时沿用你上次选的模型，不会被重置。

计划模式下的临时模型

若你在某些场景为「计划模式（Plan Mode）」单独指定了模型，/model 会同时显示当前模型与基础模型两行，让你看清此刻生效的到底是哪个。

上下文长度是什么

上下文（context） 是模型单次"能看到"的全部内容——本次会话的对话历史，以及你引用进来的文件和图片，合在一起算。上下文长度（如「100 万 token」）就是这一整包内容的容量上限。

它直接决定一个很实际的问题：一次能塞进去多少材料。

约 100 万 token：足以一次通读上百页的合同、台账或标书，无需拆分；
256K token：适合中短篇材料——几十页的文档、单份合同、一沓报销单。

上下文会累积，越长越慢

上一轮读进来的合同、之前的对话、生成的修订稿，下一轮提问时会一起再发一遍。所以即便模型上下文很大，把无关旧内容长期留在会话里仍会拖慢速度。

会话变长、变慢时：开新活用 /clear 清空，接着干用 /compact 压缩。详见上下文与引用。

不同模型适合什么场景

模型的取舍主要在上下文长度和响应速度之间：材料越长越需要大上下文，任务越轻越能用快速档提速。

场景	建议模型	为什么
通读百页合同 / 台账 / 标书	`deepseek-v4-pro`（默认）	上下文最长，整份材料一次读尽不拆分
按红线逐条核验合同、出修订稿	`deepseek-v4-pro`（默认）	长材料 + 核验对能力要求高，默认主力最稳
同样需要大上下文的备选	`qwen37plus`	百万级上下文，处理长材料的另一选择
中短文档快速提炼、改写	`qwen36-35A3B`	材料不长，响应轻快、出活更快

一个简单的判断法

材料长、要审要核 → 默认主力；材料短、图省事 → 换快速的。拿不准时，默认主力永远是安全选项。

模型清单如何更新

你不需要手动维护模型列表：

可用模型与对应上下文长度由服务方统一配置，对你免维护；
升级到新版本后第一次打开，海慧智擎会自动对齐到最新的模型清单——服务方调整了可用模型，所有客户更新后自动同步；
这个过程会保留你已选的模型和 API Key，不会把你切回默认。

因此，若某次更新后 /model 菜单里的模型有了变化，是正常的——以菜单实际列出的为准即可。

在哪里改

模型是面向用户仅有的两项可改配置之一（另一项是 API Key），写在 ~/.hi/settings.json。日常直接用 /model 切换就好，无需手动编辑文件。关于配置文件本身，见常见问题。

接下来

想搞清"上下文"以及怎么给它瘦身？看上下文与引用。
三分钟跑通第一个任务？看快速上手。
想看它「读·写·查·办」的能力全貌？回到介绍。

模型 ​

可用模型 ​

用 /model 切换 ​

上下文长度是什么 ​

不同模型适合什么场景 ​

模型清单如何更新 ​

在哪里改 ​

接下来 ​

模型

可用模型

用 /model 切换

上下文长度是什么

不同模型适合什么场景

模型清单如何更新

在哪里改

接下来