Skip to content

Sakura Desktop Pet

Desktop Companion Agent

Sakura Desktop Pet

一个会主动感知屏幕、用原生 tool_calls 调用工具、把记忆交给你管理的桌面角色 Agent。不是聊天框的外壳,是能陪你工作、提醒你、帮你处理任务的桌面伙伴。

角色包
.char 一键导入
Agent
原生 tool_calls
扩展
插件 + MCP

传统聊天机器人是一扇门,你不敲,它永远不会开。Sakura 想做的是另一种东西——一个窝在你屏幕角落的角色:你不必一直陪她说话,但她会留意你在做什么,觉得该开口时自己凑过来。

比如你在打游戏连续失败,她瞥一眼屏幕,小声提醒「已经第三次了喔……要不我帮你查查攻略?」。你点点头,她就真的打开浏览器搜一圈,再把重点贴进备忘录。

这背后是角色卡驱动她的语气、表情和声音,内置 Agent 引擎给了她真正的工具能力。她不是聊天框的外壳,是一个会主动找你的桌面伙伴。

同样接一个大模型,Sakura 不是聊天框的外壳:

维度普通聊天机器人Sakura
互动你先开口才回应主动感知,按需凑过来
上下文仅文字屏幕视觉摘要纳入对话
工具多为纯文本,少有工具原生 tool_calls:网页 / 文件 / 提醒 / 搜索,高风险确认
记忆会话结束即忘按轮次自动总结,本地向量离线,可查可改
形象一个文本框角色卡驱动立绘 / 表情 / 双语字幕 / 语音
定制改改提示词.char 角色包 + Characters Studio + 插件 / MCP
N.A.V.I. 桌宠角色与任务支持界面

感知、工具、记忆和角色表达串在同一条运行链路里,不止一个会说话的立绘。

主动感知

定期截图生成视觉摘要并纳入上下文,也可以随时按需观察屏幕;她会周期性评估此刻是否该开口,间隔与冷却时间都能配置。

不用你先开口,她自己凑过来。

长期记忆

每隔设定的对话轮次,她在后台自动从聊天记录里总结、更新和删除记忆,不打断对话;本地向量模型离线检索,无需联网。

她记住的一切,你都能在记忆设置里查看和修改。

插件与 MCP 扩展

本地插件自动发现加载,可注册工具、动态上下文、设置页、输入区控件、提示词补丁和渲染后端;任意 MCP Server 即插即用,内置 Web 搜索。

能力边界由你扩展。

原生工具循环

基于 OpenAI 兼容接口的 tool_calls:截图、打开网页、待办、提醒、笔记、搜索同轮调度,高风险操作执行前先弹出确认。

分段双语表达

模型输出日文原文、中文字幕、语气标签和立绘指令,字幕、表情与语音同步驱动,配逐字打字机动效。

语音 TTS

集成 GPT-SoVITS,一键下载整合包(RTX 50 系 / 通用 N 卡 / CPU),也可接入自部署的外置服务。

外观可调

纯色、高斯模糊、亚克力与 macOS 原生毛玻璃;气泡和输入栏的位置、大小都能调。

角色以 .char 包为单位分发:人格卡、立绘与表情映射、主题色、语气和 GPT-SoVITS 语音权重打包在一起。导入一个 .char,整套对话风格、外观和声音随之切换。

想做自己的角色?Sakura 自带 Characters Studio,向导式制作可分发的角色包:

1新建 / 导入
2基础信息
3人格卡
4立绘绑定
5语音模型
6参考音频
7主题配色
8校验导出 .char

编辑全程在隔离工作区进行,不会动到正在使用的角色目录,编辑器也与桌宠共用同一套视觉。详细字段说明见角色包制作指南

想直接用桌宠的人

下载 Release 完整包,导入角色包,配置模型后即可运行。Windows 主要测试平台,macOS 和 Linux 可按源码路径运行。

想做角色包的人

用自带的 Characters Studio 向导式制作,或手写角色目录——角色卡、立绘、主题色、语音参考一包打包,适合做可分发的桌面角色。参见 角色包制作指南

想扩展 Agent 的开发者

插件可以注册工具、注入动态上下文、监听宿主事件、扩展设置页和聊天输入区,也能接入新的角色渲染后端。

安装与配置开始。已经装好 Sakura 的话,直接看 API 配置功能概览