模型配置
Midscene 通过读取操作系统中指定的环境变量来完成配置。
Midscene 默认集成了 OpenAI SDK 调用 AI 服务,它限定了推理服务的参数风格,绝大多数模型服务商(或模型部署工具)都提供了满足这种要求的接口。
本篇文档会重点介绍 Midscene 的模型配置参数。如果你对 Midscene 的模型策略感兴趣,请阅读 模型策略。如果你想查看常用模型的配置示例,请阅读 常用模型配置。
必选配置
你需要为 Midscene 配上一个默认模型,详见 模型策略 文档。
使用 Codex App Server(OAuth,无需 API Key)
如果你已经通过 Codex CLI 登录(codex login),并希望 Midscene 直接复用该 OAuth 会话,可设置:
说明:
- 该模式下不需要
MIDSCENE_MODEL_API_KEY。 - Midscene 会通过 stdio 调用
codex app-server。 - 请确保
codex在 PATH 中可用,并通过codex login status确认登录状态。 - 使用该模式时,无法在发送图片时指定
"detail": "original"参数,因此无法获得最佳的定位效果。详情请参考 Images and Vision guide 和 Computer use guide。
高阶配置(可选)
如果你为 Insight 或 Planning 配置了独立模型,那么本节中的模型相关 MIDSCENE_MODEL_* 配置需要使用对应的 MIDSCENE_INSIGHT_MODEL_* 或 MIDSCENE_PLANNING_MODEL_* 配置才能在 Insight 或 Planning 意图时生效。
提示:通过 Agent 的
replanningCycleLimit入参控制重规划次数(默认 20,vlm-ui-tars为 40),不再使用环境变量。

