当前阶段为本地 Mock 项目,请不要填写真实 API Key,也不要上传身份证、银行卡、密码等高敏感文件。
显示引用来源
在知识库问答中显示引用的文档片段
temperature 越高,回复越发散;越低,回复越稳定。
控制单次回复最大长度,数值越大可能消耗越多 tokens。
流式输出
开启后 AI 回复会逐步显示
请求前确认
发送真实 AI 请求前弹出确认
自动裁剪上下文
长对话自动裁剪较早消息以减少 token 消耗