Skip to content

模型

海慧智擎背后是一组可切换的大模型。默认配置开箱即用,你通常不用管模型也能把活干完;当某项任务对"上下文长度"或"响应速度"有特别要求时,再用 /model 切一下即可。

本页讲清三件事:有哪些模型、/model 怎么切、不同模型分别适合什么场景。

可用模型

出厂默认提供以下模型,以默认主力为首选:

模型单次上下文定位
deepseek-v4-pro100 万 token默认主力,能力最全,适合绝大多数任务
qwen37plus100 万 token大上下文备选,适合长材料处理
qwen36-35A3B256K token响应轻快,适合中短材料的快速处理

不确定选哪个?

保持默认的 deepseek-v4-pro 就好。它上下文最长、能力最全,合同审查、台账汇总、标书响应这类日常事务都能稳稳接住。先把活交给默认模型,等遇到具体瓶颈再考虑切换。

上表是出厂标准清单。具体可用的模型由服务方(贵司管理员)统一配置,可能与上表略有出入——以你机器上 /model 菜单里实际列出的为准。

用 /model 切换

在交互界面里输入 /model,有三种用法:

text
/model
text
/model qwen36-35A3B
text
/model status
  • /model(不带参数):弹出模型选择菜单,用方向键选、回车确认,切换即时生效;
  • /model [模型名]:跳过菜单,直接切到指定模型;
  • /model status:不切换,只显示当前正在用的模型。

切换后界面会提示 已切换至 …,本次会话后续的对话都用新模型。下次启动时沿用你上次选的模型,不会被重置。

计划模式下的临时模型

若你在某些场景为「计划模式(Plan Mode)」单独指定了模型,/model 会同时显示当前模型基础模型两行,让你看清此刻生效的到底是哪个。

上下文长度是什么

上下文(context) 是模型单次"能看到"的全部内容——本次会话的对话历史,以及你引用进来的文件和图片,合在一起算。上下文长度(如「100 万 token」)就是这一整包内容的容量上限

它直接决定一个很实际的问题:一次能塞进去多少材料

  • 约 100 万 token:足以一次通读上百页的合同、台账或标书,无需拆分;
  • 256K token:适合中短篇材料——几十页的文档、单份合同、一沓报销单。

上下文会累积,越长越慢

上一轮读进来的合同、之前的对话、生成的修订稿,下一轮提问时会一起再发一遍。所以即便模型上下文很大,把无关旧内容长期留在会话里仍会拖慢速度。

会话变长、变慢时:开新活用 /clear 清空,接着干用 /compact 压缩。详见上下文与引用

不同模型适合什么场景

模型的取舍主要在上下文长度响应速度之间:材料越长越需要大上下文,任务越轻越能用快速档提速。

场景建议模型为什么
通读百页合同 / 台账 / 标书deepseek-v4-pro(默认)上下文最长,整份材料一次读尽不拆分
按红线逐条核验合同、出修订稿deepseek-v4-pro(默认)长材料 + 核验对能力要求高,默认主力最稳
同样需要大上下文的备选qwen37plus百万级上下文,处理长材料的另一选择
中短文档快速提炼、改写qwen36-35A3B材料不长,响应轻快、出活更快

一个简单的判断法

材料长、要审要核 → 默认主力材料短、图省事 → 换快速的。拿不准时,默认主力永远是安全选项。

模型清单如何更新

你不需要手动维护模型列表:

  • 可用模型与对应上下文长度由服务方统一配置,对你免维护;
  • 升级到新版本后第一次打开,海慧智擎会自动对齐到最新的模型清单——服务方调整了可用模型,所有客户更新后自动同步;
  • 这个过程会保留你已选的模型和 API Key,不会把你切回默认。

因此,若某次更新后 /model 菜单里的模型有了变化,是正常的——以菜单实际列出的为准即可。

在哪里改

模型是面向用户仅有的两项可改配置之一(另一项是 API Key),写在 ~/.hi/settings.json。日常直接用 /model 切换就好,无需手动编辑文件。关于配置文件本身,见常见问题

接下来

  • 想搞清"上下文"以及怎么给它瘦身?看上下文与引用
  • 三分钟跑通第一个任务?看快速上手
  • 想看它「读·写·查·办」的能力全貌?回到介绍

数据全程不出域 · 本地部署