2026年5月8日星期五

问 Loom 任何关于项目的问题… K

Quality Spectrum

当 90% 输出是 AI 产的，质量不再是单一 score · 6 维实时信号 · 决定该不该让人介入

异源 AI 审 · 实时

全绿 · auto-pass

13 / 22

59% · PM 不用看

黄 · 看摘要

7 / 22

扫一眼即可

红 · 必看

2 / 22

必须人审 · 不能 auto-pass

意图偏离 ≥30%

2 条 stream

self-review 时 AI 强制反问

为什么需要 6 维质量光谱？

当 90% 输出是 AI 产的，单一的「通过/驳回」score 已经死亡——AI 输出看起来像那么回事的概率极高，但 6 个维度的失败模式各不相同：代码可能正确但偏离意图、文档可能优雅但引用幻觉、prompt 可能精炼但与团队 baseline 漂移。 PM 不该读所有产出 · 只该看「光谱亮红的那部分」。全绿 auto-pass、黄扫摘要、红必审——这是 AI 时代 review 的最优注意力分配。

6 维团队平均分 · 本周

事实正确

91

lint / test / build

Context 一致

86

异源 AI 审

意图保真

86

anchor 偏离距离

复用信号

82

后续被引用

风格漂移

87

vs 团队 baseline

幻觉风险

95

引用真实存在性

Stream 维度 · 各人产出质量分布

Stream

Checkpoints

Quality 分布

意图保真

SQL 改写第 3 批 · alias 规范修订中…

3绿 · 0黄 · 0红

"把 32 个 SQL 文件迁移到新 schema · alias 全小写 ·…"

招行风控接口契约 · 12 iter 未收敛…

0绿 · 1黄 · 1红

"起草招行 FCAP-3 接口契约 · 字段命名遵循 v2 spec · 与客…"

BI 平台数据建模 v2…

3绿 · 2黄 · 0红

"BI 数据模型 v2 · 重构 format.ts 移除老式 callbac…"

format.ts 测试用例（即将撞 p003）…

2绿 · 1黄 · 0红

"美的权限体系 240 条回归用例 · 边界值优先 · 覆盖多角色嵌套…"

招行客户跟进邮件 + V3 标签结构…

0绿 · 2黄 · 0红

"V3 三层标签 spec + 招行客户跟进邮件 · 引用 5/8 评审会决策…"

蔚来 spec v1.3 起草…

2绿 · 0黄 · 0红

"蔚来 spec v1.3 + 元气 mock 接口方案…"

美的 UAT 报告 + 客户演练 demo…

2绿 · 0黄 · 0红

"美的 UAT 第三轮报告 · 含 risk timeline · 客户友好版…"

OKR 评分模型文档化…

0绿 · 1黄 · 1红

"OKR 评分模型文档化 · 按 4/19 决策日志『不计加权』 · 反映现行…"

美的客户演练 demo 视觉…

1绿 · 0黄 · 0红

"美的客户演练 demo 视觉规范 v1…"

按维度 · 最差产出 Top 3一眼看出哪一类质量问题集中爆发

事实正确

lint / test / build

91

avg

唐

FCAP-3 接口字段定义 v1-v5（全部 abandoned）

唐知微 · failed_attempt

60

唐

黑名单 enum 类型定义

唐知微 · pr

88

江

智能客服 prompt v0.3

江晚舟 · doc

88

Context 一致

异源 AI 审

86

avg

唐

FCAP-3 接口字段定义 v1-v5（全部 abandoned）

唐知微 · failed_attempt

35

高

招行魏总跟进邮件草稿

高远舟 · doc

70

陈

API 文档 v2 起草

陈方圆 · doc

78

意图保真

anchor 偏离距离

86

avg

唐

FCAP-3 接口字段定义 v1-v5（全部 abandoned）

唐知微 · failed_attempt

22

周

OKR 评分模型 spec

周衍宁 · doc

58

唐

黑名单 enum 类型定义

唐知微 · pr

86

复用信号

后续被引用

82

avg

唐

黑名单 enum 类型定义

唐知微 · pr

72

韩

回归测试用例 240 条

韩青砚 · test

78

周

招行项目周报草稿

周衍宁 · doc

78

风格漂移

vs 团队 baseline

87

avg

唐

FCAP-3 接口字段定义 v1-v5（全部 abandoned）

唐知微 · failed_attempt

48

高

V3 客户标签三层结构 spec

高远舟 · doc

84

卢

SQL 改写第 3 批 · 32 文件

卢雨棠 · pr

86

幻觉风险

引用真实存在性

95

avg

唐

FCAP-3 接口字段定义 v1-v5（全部 abandoned）

唐知微 · failed_attempt

32

周

OKR 评分模型 spec

周衍宁 · doc

88

卢

Schema 迁移 changelog

卢雨棠 · doc

95

Quality Calibration Loop · review 即学习

本周人审驳回

4

→ Sentinel-δ trust -1.2 · Coda-α trust -0.4
→ 4 个反模式候选进 Pattern Forge

人审通过且高效

18

→ 该类任务抽样率从 20% 降到 12%
→ 2 个好模式候选晋升中

异源 AI flag 但人审通过

3

→ 异源 review 策略校准
→ 减少 false positive

核心原则：每次 review 不只是 yes/no · 反哺 trust + pattern · review 系统每天都在变得更准。这是 Loom 越用越走不掉的核心粘性。