Quality Spectrum
当 90% 输出是 AI 产的,质量不再是单一 score · 6 维实时信号 · 决定该不该让人介入
异源 AI 审 · 实时
全绿 · auto-pass
13 / 22
59% · PM 不用看
黄 · 看摘要
7 / 22
扫一眼即可
红 · 必看
2 / 22
必须人审 · 不能 auto-pass
意图偏离 ≥30%
2 条 stream
self-review 时 AI 强制反问
为什么需要 6 维质量光谱?
当 90% 输出是 AI 产的,单一的「通过/驳回」score 已经死亡——AI 输出看起来像那么回事的概率极高,但 6 个维度的失败模式各不相同: 代码可能正确但偏离意图、文档可能优雅但引用幻觉、prompt 可能精炼但与团队 baseline 漂移。 PM 不该读所有产出 · 只该看「光谱亮红的那部分」。 全绿 auto-pass、黄扫摘要、红必审——这是 AI 时代 review 的最优注意力分配。
6 维团队平均分 · 本周
事实正确
91
lint / test / build
Context 一致
86
异源 AI 审
意图保真
86
anchor 偏离距离
复用信号
82
后续被引用
风格漂移
87
vs 团队 baseline
幻觉风险
95
引用真实存在性
Stream 维度 · 各人产出质量分布
Stream
Checkpoints
Quality 分布
意图保真
卢
卢雨棠
SQL 改写第 3 批 · alias 规范修订中…
3 cp
3绿 · 0黄 · 0红
"把 32 个 SQL 文件迁移到新 schema · alias 全小写 ·…"
偏离 18%
唐
唐知微
招行风控接口契约 · 12 iter 未收敛…
2 cp
0绿 · 1黄 · 1红
"起草招行 FCAP-3 接口契约 · 字段命名遵循 v2 spec · 与客…"
偏离 78%
陈
陈方圆
BI 平台数据建模 v2…
5 cp
3绿 · 2黄 · 0红
"BI 数据模型 v2 · 重构 format.ts 移除老式 callbac…"
偏离 12%
韩
韩青砚
format.ts 测试用例(即将撞 p003)…
3 cp
2绿 · 1黄 · 0红
"美的权限体系 240 条回归用例 · 边界值优先 · 覆盖多角色嵌套…"
偏离 21%
高
高远舟
招行客户跟进邮件 + V3 标签结构…
2 cp
0绿 · 2黄 · 0红
"V3 三层标签 spec + 招行客户跟进邮件 · 引用 5/8 评审会决策…"
偏离 15%
江
江晚舟
蔚来 spec v1.3 起草…
2 cp
2绿 · 0黄 · 0红
"蔚来 spec v1.3 + 元气 mock 接口方案…"
偏离 24%
严
严观海
美的 UAT 报告 + 客户演练 demo…
2 cp
2绿 · 0黄 · 0红
"美的 UAT 第三轮报告 · 含 risk timeline · 客户友好版…"
偏离 18%
周
周衍宁
OKR 评分模型文档化…
2 cp
0绿 · 1黄 · 1红
"OKR 评分模型文档化 · 按 4/19 决策日志『不计加权』 · 反映现行…"
偏离 42%
苏
苏婉清
美的客户演练 demo 视觉…
1 cp
1绿 · 0黄 · 0红
"美的客户演练 demo 视觉规范 v1…"
偏离 20%
按维度 · 最差产出 Top 3一眼看出哪一类质量问题集中爆发
事实正确
lint / test / build
91
avg
唐
FCAP-3 接口字段定义 v1-v5(全部 abandoned)
唐知微 · failed_attempt
60
唐
黑名单 enum 类型定义
唐知微 · pr
88
江
智能客服 prompt v0.3
江晚舟 · doc
88
Context 一致
异源 AI 审
86
avg
唐
FCAP-3 接口字段定义 v1-v5(全部 abandoned)
唐知微 · failed_attempt
35
高
招行魏总跟进邮件草稿
高远舟 · doc
70
陈
API 文档 v2 起草
陈方圆 · doc
78
意图保真
anchor 偏离距离
86
avg
唐
FCAP-3 接口字段定义 v1-v5(全部 abandoned)
唐知微 · failed_attempt
22
周
OKR 评分模型 spec
周衍宁 · doc
58
唐
黑名单 enum 类型定义
唐知微 · pr
86
复用信号
后续被引用
82
avg
唐
黑名单 enum 类型定义
唐知微 · pr
72
韩
回归测试用例 240 条
韩青砚 · test
78
周
招行项目周报草稿
周衍宁 · doc
78
风格漂移
vs 团队 baseline
87
avg
唐
FCAP-3 接口字段定义 v1-v5(全部 abandoned)
唐知微 · failed_attempt
48
高
V3 客户标签三层结构 spec
高远舟 · doc
84
卢
SQL 改写第 3 批 · 32 文件
卢雨棠 · pr
86
幻觉风险
引用真实存在性
95
avg
唐
FCAP-3 接口字段定义 v1-v5(全部 abandoned)
唐知微 · failed_attempt
32
周
OKR 评分模型 spec
周衍宁 · doc
88
卢
Schema 迁移 changelog
卢雨棠 · doc
95
Quality Calibration Loop · review 即学习
本周人审驳回
4
→ Sentinel-δ trust -1.2 · Coda-α trust -0.4
→ 4 个反模式候选进 Pattern Forge
→ 4 个反模式候选进 Pattern Forge
人审通过且高效
18
→ 该类任务抽样率从 20% 降到 12%
→ 2 个好模式候选晋升中
→ 2 个好模式候选晋升中
异源 AI flag 但人审通过
3
→ 异源 review 策略校准
→ 减少 false positive
→ 减少 false positive
核心原则:每次 review 不只是 yes/no · 反哺 trust + pattern · review 系统每天都在变得更准。这是 Loom 越用越走不掉的核心粘性。