视图密度

Plan-B technology overview

AI SDK + DBOS 伴学系统 / 共识推进器技术总览

该页面将施工包中的核心技术口径压缩为一份浏览器可直接查看的系统图。 重点回答五件事:系统分层怎么拆、实时对话与 DBOS 长流程如何协同、 正式节点状态机如何推进、执行期观察与用户暂停如何落地, 以及哪些属于稳定骨架、哪些属于可变策略层。

最高定位:伴学系统 对话机制:共识推进器 推荐对象:Action Bundle 持久编排:DBOS

统一后的技术判断

技术口径统一 `AI SDK` 负责 LLM 交互,`DBOS` 负责 durable orchestration。
业务纪律统一 稳定的是骨架,不稳定的是策略;实时对话不被长流程接管。
策略要素显式化 三类身份族、六个画像、四阶段矩阵、A–H 能力域进入正式策略层。
执行微循环显式化 主动观察、轻触达、小共识、重启共识与用户暂停进入正式施工口径。
01 总体架构 02 实时对话与 DBOS 03 节点状态机 04 执行观察与暂停 05 稳定骨架与策略层

01. 五层总体架构

系统被拆成渠道与体验、AI SDK、DBOS、业务决策、数据与知识五层。 颜色表达的是“职责边界”,不是部署单元。

来自主方案 4.1 / 5.x
Plan-B 伴学系统技术骨架

渠道与体验层

H5 / App / 小程序 / 企微 / 顾问工作台 / 卡片与任务面板

LLM 交互标准层

AI SDK:provider、schema、tools、stream、消息协议与 fallback

旅程编排层

DBOS:sleep / wake、外部事件恢复、人工接管、补偿、重试、回放

业务决策层

状态机、规则引擎、候选动作召回、LLM 重排、风控审核、A/B 分流

数据与知识层

画像、行为、学习记录、成绩、服务 Catalog、政策库、运营策略库

前端触点调用 durable orchestration structured truth
对外口径 产品最高定位是伴学系统,共识推进器只是其中的对话推进机制。
AI SDK 边界 只做模型交互、schema、tool orchestration、流式体验,不持有业务真相。
DBOS 边界 只做跨时间、可恢复、可审计的 durable orchestration,不直接承载业务判断。
业务真相 阶段、计划、分流结论、窗口状态等仍落在业务库与规则服务。

02. 实时对话热路径与 DBOS 长流程协同

实时轮次由 `DialogueOrchestrator` 主导,跨时间跟进由 DBOS workflow 接管。 二者通过事实事件和审计链衔接,而不是混写在同一条即时处理链里。

来自主方案 5.x / 11.x / 第三轮任务包
实时对话热路径 跨时间 durable orchestration

接入请求

Hono / BFF 接收用户消息或顾问操作

状态装配

读取画像、历史行为、阶段、窗口与禁推项

DialogueOrchestrator

决定 posture、能力矩阵、可见 tools、prompt 版本

AI SDK 调用

object / stream / tools / schema parse / provider route

受控工具调用

只访问白名单工具与能力域,不绕过业务真相

写事实与审计

conversation、tool log、snapshot、transition event

发 canonical event

PLAN_ACCEPTED / FIRST_ACTION_STARTED / WINDOW_OPENED

DBOS workflow 启动

first consultation → 48h / day3 / day7 / time window follow-up

sleep / wake / branch

等待时间窗口、学习行为、成绩事实、人工接管结果

副作用闸门

提醒、顾问待办、结果汇总、人工回写后的恢复继续

run 级可观测

step log、retry、idempotency、outcome digest

事实事件触发 durable wait idempotent side effect

03. 正式节点状态机与窗口服务

`N1-N11` 是当前 v1 active 节点;`N12-N17` 属于 exam window / branching / interview 等扩展链路。图中同时表达主链、干预链、考试窗口与分流回流。

来自节点状态机 / 事件字典 / 守卫表
v1 active 主链 + 干预链 + exam window / branching

N1 建立伴学关系

识别 / 轻澄清 / 最小画像

N2 当前状态澄清

目标 / 障碍 / 当前阶段收敛

N3 节奏与策略共识

策略解释 / 轻计划预览

N4 计划确认

计划生成 / 首动作明确

N5 首动作启动

邀请启动 / 轻 check-in

N6 连续行为形成

执行观察窗口 / 节奏稳定

N7 计划微调

计划失配后的受控改写

N8 进度干预

掉队识别 / 恢复动作

N9 结果干预

低正确率 / 卡点诊断

N10 阻力承接与恢复

情绪 / 时间 / 动力阻力

N11 人工接管

高风险升级 / 人工回写

N12 选岗陪伴

选岗窗口

N13 考前护航

考前 1–7 天

N14 考后即时承接

考后 0–2 小时

N15 估分与等待

估分 / waiting for score

N16 结果分流承接

branch explain / retry / near miss

N17 面试准备承接

interview prep 计划与启动

偏差 / 掉队 / 卡点 阻力升级 rebuild / recover exam window / post exam / branching branch back to plan / retry

04. 执行期观察微循环与用户暂停

最新业务口径新增的“主动观察、进度观察、效果观察、情绪 / 环境观察”以及“用户可暂停”, 在 Plan-B 中不改主骨架,而是落到执行期微循环、暂停覆盖态与 DBOS 监督型 workflow。

来自节点状态机 / 事件字典 / 动作包与工具 Catalog
执行期微循环 暂停 / 升级边界

DBOS 监督型 workflow

day3 / day7 / 窗口唤醒后重新读业务真相

主动观察

不等用户求助,按节奏检查执行事实

进度观察

判断轻微 / 严重落后,不直接改计划

效果观察

基于题目、模考、正确率与速度证据

情绪 / 环境观察

只决定承接优先级和触达强度

轻触达

低压力提醒、复盘卡或今日最小任务

小共识

轻量确认节奏或受控微调

重启共识

中断、掉队或暂停后的恢复前置

恢复执行链

回 N5 / N6 / N7 继续观察

用户主动暂停 / 请假

request_user_pause,进入 PAUSED_BY_USER

暂停期静默策略

禁止高频提醒、强推进、强计划调整

暂停后恢复

resume_after_user_pause 后先小共识 / 重启共识

N11 人工接管

仅高风险、投诉、多轮失败或用户明确要求人工

progress / effect / emotion resume with consensus quiet window not ordinary pause
ExecutionObservationLoop 把观察、触达、小共识、重启共识做成策略对象,而不是零散定时任务。
UserPausePolicy 用户主动暂停进入 `PAUSED_BY_USER`,不默认等同于 `N11` 人工接管。
工具边界 `request_user_pause` 与 `resume_after_user_pause` 是正式工具,且必须审计。
恢复纪律 暂停后不能沿旧计划强推,必须先确认小共识或重启共识。

05. 稳定骨架 vs 可变策略层

该图是本轮收口后的核心工程纪律。左侧是长期稳定的制度层, 右侧是随业务口径调整而版本化演进的策略层。

来自稳定骨架与可变策略层说明
稳定骨架 可变策略层

主状态机骨架

LINKING → CONSENSUS → PLAN → EXECUTION → EXAM → BRANCH → INTERVIEW

业务真相边界

当前有效计划、分流结论、窗口状态等落业务库,DBOS 运行态不替代真相

热路径与 DBOS 边界

实时轮次归 DialogueOrchestrator,跨时间恢复归 DBOS

事件语言与审计链

canonical event、tool audit、prompt replay、workflow step log

不可轻易改动

这是制度层总线图,不因单点业务变化而重写

人群矩阵

三类身份族、六个典型画像、时间预算带、家庭压力带

阶段矩阵

入门期 / 系统期 / 卡点期 / 冲刺期 × 首次 / 二战 / 多战

A–H 能力注册表

capability binding、tool visibility、审计策略、输出协议

执行观察与暂停策略

ExecutionObservationLoop、UserPausePolicy、轻触达、小共识与重启共识

服务触发与分流延展

临考 / 查分 / 面试、再入场、职业延展与模板版本

策略输入 binding rules visibility / policy observe / pause
UserSegmentProfile 身份族、画像、时间预算与压力带是正式策略输入,不再只是产品文案。
PreparationStrategyProfile 四阶段 × 轮次带负责决定动作、节奏、干预强度和观察窗口。
CapabilityRegistry A–H 能力域是协议层,不在业务代码里散落硬编码判断。
ExecutionObservationLoop 主动观察、进度观察、效果观察与情绪 / 环境观察进入可变策略层。
UserPausePolicy 暂停期触达、恢复日前唤醒、逾期承接与恢复策略均允许版本化。
Career Extension 职业发展共识已预留为 v2 reserved,不阻塞 v1 主链施工。