2026年5月8日星期五

Quality Spectrum

当 90% 输出是 AI 产的,质量不再是单一 score · 6 维实时信号 · 决定该不该让人介入

异源 AI 审 · 实时
全绿 · auto-pass
13 / 22
59% · PM 不用看
黄 · 看摘要
7 / 22
扫一眼即可
红 · 必看
2 / 22
必须人审 · 不能 auto-pass
意图偏离 ≥30%
2 条 stream
self-review 时 AI 强制反问
为什么需要 6 维质量光谱?

当 90% 输出是 AI 产的,单一的「通过/驳回」score 已经死亡——AI 输出看起来像那么回事的概率极高,但 6 个维度的失败模式各不相同: 代码可能正确但偏离意图、文档可能优雅但引用幻觉、prompt 可能精炼但与团队 baseline 漂移。 PM 不该读所有产出 · 只该看「光谱亮红的那部分」。 全绿 auto-pass、黄扫摘要、红必审——这是 AI 时代 review 的最优注意力分配。

6 维团队平均分 · 本周
事实正确
91
lint / test / build
Context 一致
86
异源 AI 审
意图保真
86
anchor 偏离距离
复用信号
82
后续被引用
风格漂移
87
vs 团队 baseline
幻觉风险
95
引用真实存在性
Stream 维度 · 各人产出质量分布
按维度 · 最差产出 Top 3一眼看出哪一类质量问题集中爆发
事实正确
lint / test / build
91
avg
FCAP-3 接口字段定义 v1-v5(全部 abandoned)
唐知微 · failed_attempt
60
黑名单 enum 类型定义
唐知微 · pr
88
智能客服 prompt v0.3
江晚舟 · doc
88
Context 一致
异源 AI 审
86
avg
FCAP-3 接口字段定义 v1-v5(全部 abandoned)
唐知微 · failed_attempt
35
招行魏总跟进邮件草稿
高远舟 · doc
70
API 文档 v2 起草
陈方圆 · doc
78
意图保真
anchor 偏离距离
86
avg
FCAP-3 接口字段定义 v1-v5(全部 abandoned)
唐知微 · failed_attempt
22
OKR 评分模型 spec
周衍宁 · doc
58
黑名单 enum 类型定义
唐知微 · pr
86
复用信号
后续被引用
82
avg
黑名单 enum 类型定义
唐知微 · pr
72
回归测试用例 240 条
韩青砚 · test
78
招行项目周报草稿
周衍宁 · doc
78
风格漂移
vs 团队 baseline
87
avg
FCAP-3 接口字段定义 v1-v5(全部 abandoned)
唐知微 · failed_attempt
48
V3 客户标签三层结构 spec
高远舟 · doc
84
SQL 改写第 3 批 · 32 文件
卢雨棠 · pr
86
幻觉风险
引用真实存在性
95
avg
FCAP-3 接口字段定义 v1-v5(全部 abandoned)
唐知微 · failed_attempt
32
OKR 评分模型 spec
周衍宁 · doc
88
Schema 迁移 changelog
卢雨棠 · doc
95
Quality Calibration Loop · review 即学习
本周人审驳回
4
→ Sentinel-δ trust -1.2 · Coda-α trust -0.4
→ 4 个反模式候选进 Pattern Forge
人审通过且高效
18
→ 该类任务抽样率从 20% 降到 12%
→ 2 个好模式候选晋升中
异源 AI flag 但人审通过
3
→ 异源 review 策略校准
→ 减少 false positive
核心原则:每次 review 不只是 yes/no · 反哺 trust + pattern · review 系统每天都在变得更准。这是 Loom 越用越走不掉的核心粘性。