原生工具循环
基于 OpenAI 兼容接口的 tool_calls:截图、打开网页、待办、提醒、笔记、搜索同轮调度,高风险操作执行前先弹出确认。
Desktop Companion Agent
一个会主动感知屏幕、用原生 tool_calls 调用工具、把记忆交给你管理的桌面角色 Agent。不是聊天框的外壳,是能陪你工作、提醒你、帮你处理任务的桌面伙伴。
传统聊天机器人是一扇门,你不敲,它永远不会开。Sakura 想做的是另一种东西——一个窝在你屏幕角落的角色:你不必一直陪她说话,但她会留意你在做什么,觉得该开口时自己凑过来。
比如你在打游戏连续失败,她瞥一眼屏幕,小声提醒「已经第三次了喔……要不我帮你查查攻略?」。你点点头,她就真的打开浏览器搜一圈,再把重点贴进备忘录。
这背后是角色卡驱动她的语气、表情和声音,内置 Agent 引擎给了她真正的工具能力。她不是聊天框的外壳,是一个会主动找你的桌面伙伴。
同样接一个大模型,Sakura 不是聊天框的外壳:
| 维度 | 普通聊天机器人 | Sakura |
|---|---|---|
| 互动 | 你先开口才回应 | 主动感知,按需凑过来 |
| 上下文 | 仅文字 | 屏幕视觉摘要纳入对话 |
| 工具 | 多为纯文本,少有工具 | 原生 tool_calls:网页 / 文件 / 提醒 / 搜索,高风险确认 |
| 记忆 | 会话结束即忘 | 按轮次自动总结,本地向量离线,可查可改 |
| 形象 | 一个文本框 | 角色卡驱动立绘 / 表情 / 双语字幕 / 语音 |
| 定制 | 改改提示词 | .char 角色包 + Characters Studio + 插件 / MCP |

感知、工具、记忆和角色表达串在同一条运行链路里,不止一个会说话的立绘。
定期截图生成视觉摘要并纳入上下文,也可以随时按需观察屏幕;她会周期性评估此刻是否该开口,间隔与冷却时间都能配置。
不用你先开口,她自己凑过来。
每隔设定的对话轮次,她在后台自动从聊天记录里总结、更新和删除记忆,不打断对话;本地向量模型离线检索,无需联网。
她记住的一切,你都能在记忆设置里查看和修改。
本地插件自动发现加载,可注册工具、动态上下文、设置页、输入区控件、提示词补丁和渲染后端;任意 MCP Server 即插即用,内置 Web 搜索。
能力边界由你扩展。
原生工具循环
基于 OpenAI 兼容接口的 tool_calls:截图、打开网页、待办、提醒、笔记、搜索同轮调度,高风险操作执行前先弹出确认。
分段双语表达
模型输出日文原文、中文字幕、语气标签和立绘指令,字幕、表情与语音同步驱动,配逐字打字机动效。
语音 TTS
集成 GPT-SoVITS,一键下载整合包(RTX 50 系 / 通用 N 卡 / CPU),也可接入自部署的外置服务。
外观可调
纯色、高斯模糊、亚克力与 macOS 原生毛玻璃;气泡和输入栏的位置、大小都能调。
角色以 .char 包为单位分发:人格卡、立绘与表情映射、主题色、语气和 GPT-SoVITS 语音权重打包在一起。导入一个 .char,整套对话风格、外观和声音随之切换。
想做自己的角色?Sakura 自带 Characters Studio,向导式制作可分发的角色包:
编辑全程在隔离工作区进行,不会动到正在使用的角色目录,编辑器也与桌宠共用同一套视觉。详细字段说明见角色包制作指南。
01 安装 Sakura 下载完整包、导入角色包并完成首次启动。
02 配置模型 填写 OpenAI 兼容接口、API Key 和支持视觉输入的模型。
03 开启能力 按需启用主动关怀、TTS、记忆、工具与插件。
04 扩展插件 用 Python 插件贡献工具、上下文、UI 控件或渲染后端。
下载 Release 完整包,导入角色包,配置模型后即可运行。Windows 主要测试平台,macOS 和 Linux 可按源码路径运行。
用自带的 Characters Studio 向导式制作,或手写角色目录——角色卡、立绘、主题色、语音参考一包打包,适合做可分发的桌面角色。参见 角色包制作指南。
插件可以注册工具、注入动态上下文、监听宿主事件、扩展设置页和聊天输入区,也能接入新的角色渲染后端。