name: cognitive-calibrate description: 置信度校准(元认知监控)。追踪L1文档和L2碎片中「AI生成/推断」的内容是否事后得到了验证,定期向用户提问「这段内容当时是AI推断,现在有没有实际证据?」。触发词:「验证历史内容」「校准知识置信度」「哪些内容还没验证」「cognitive-calibrate」。也被 cognitive-consistency-check 内部调用(月度维护)。
cognitive-calibrate(置信度校准 / 元认知置信度监控)
对应认知活动:元认知的置信度校准——追踪🟡AI生成内容是否事后得到验证,防止「自我确认偏误」导致未验证的推断长期被当作事实
认知五维坐标(COG-TAX):
- 意识程度:显性(需要用户参与确认)
- 脑网络:CEN(目标导向的检索与判断)+ SN(不确定性检测)
- 记忆系统:语义记忆的准确性评估
- 执行功能:监控(Monitoring),是元认知的核心成分
- 双系统:系统2(需要主动评估,不能自动化)
理论依据:Flavell (1979) 元认知监控;Dunning & Kruger (1999) 元认知准确性;Nelson & Narens (1990) 置信度监控框架
调用时机:
- 被 cognitive-consistency-check 内部调用(月度维护,Step 8)
- 用户主动触发(「验证历史内容」「校准知识置信度」)
Headless调用说明(被 cognitive-consistency-check Step 8 调用时):
- 调用方传入默认范围参数:scope="ALL_90_DAYS"(跳过Step 0的交互选择)
- 跳过 Step 0:不询问用户,直接使用 scope="ALL_90_DAYS" 执行 Step 1
- 若筛选结果 > 10条:Headless模式下只处理前10条(避免过长执行)
- 所有 Step 4 的结果写入 todo.md,等待下次 daily-briefing 展示给用户
- 不向对话输出 Step 4 的摘要(Headless模式静默执行)
知识导航表
| 层级 | 文档 | 用途 |
|---|---|---|
| D0 碎片索引 | cognitive/L2_fragments/fragment_index.md | 找到所有「归因=🟡AI生成/推断,验证状态=未验证」的条目 |
| D0 L1 文档 | cognitive/L1_knowledge/[各维度文档](含🟡标注的段落) | 找到需要验证的具体内容 |
激活后立即执行
Step 0 确认检查范围
Ask: 本次校准的范围?
选项 A:90天以上未验证的🟡内容(全量,可能较多)
选项 B:指定某个L1文档(精准,快速)
选项 C:从上次校准以来的所有🟡内容
Step 1 读取待验证条目
Read: cognitive/L2_fragments/fragment_index.md
→ 筛选:归因类型=🟡AI生成/推断 AND 验证状态=🔲未验证 AND capture_time < 今天-[范围天数]
→ 提取:碎片ID、标题、capture_time
Read: cognitive/L1_knowledge/[目标文档]
→ 扫描🟡归因标注的段落
→ 提取:段落位置、内容摘要(前150字)、标注时间
→ 若筛选结果为0条 → 告知用户「选定范围内无需校准的内容(🟡内容已全部处理,或该范围内无🟡归因内容)」
然后退出,不继续执行 Step 2 以后的步骤
Step 2 逐条向用户展示并询问
对每个待验证条目,展示:
---
📋 [内容编号/N]
**来源**:[L1文档名 §章节] / [L2碎片ID「标题」]
**当时的归因**:🟡 AI生成/推断([capture_date],距今[N]天)
**内容摘要**:[前150字]
**问题**:这段内容当时是AI的推断。现在:
A. ✅ 已有实际证据支持(标记为「已验证」)
B. ❌ 事后发现是错的(标记为「已否定」,需要修订L1/L2)
C. ⏸️ 还不确定,继续观察
D. ⏭️ 跳过这条(稍后处理)
---
Step 3 根据用户回答更新验证状态
A(已验证):
→ 更新 fragment_index.md:验证状态=✅已验证,verified_date=今天
→ 更新 L1 文档:将🟡标注改为✅(StrReplace)
B(已否定):
→ 更新 fragment_index.md:验证状态=❌已否定,verified_date=今天
→ 在 cognitive/L3_logs/todo.md 追加:
□ [校准-YYYYMMDD] 碎片[ID]/[L1段落]已被否定,需要修订对应内容
建议:运行 cognitive-update-knowledge 或 cognitive-detect-contradiction
→ 不自动修改 L1(修订需要用户确认)
C(继续观察):
→ 更新 fragment_index.md:验证状态=⏸️观察中,last_check=今天
→ 不做其他操作
D(跳过):
→ 不更新验证状态
→ 记录「已跳过」供下次校准时再展示
Step 4 生成校准摘要
输出:
---
## 置信度校准摘要([今日日期])
处理条目:N条
- ✅ 已验证:X条
- ❌ 已否定(需修订):Y条 → 已加入待完成清单
- ⏸️ 继续观察:Z条
- ⏭️ 跳过:W条(下次校准时再显示)
---
Step 5 追加系统日志
Write: cognitive/L3_logs/system_log.md(追加)
格式:[LOG-YYYYMMDD-NN] cognitive-calibrate | 校准完成:验证X条,否定Y条,观察Z条 | fragment_index.md
归因标注说明
| 归因类型 | 含义 | 需要校准? |
|---|---|---|
| 🟢 user_original | 用户直接说出的内容 | 否 |
| 🟡 ai_inference | AI推断/合成,未经用户确认 | 是(本Skill的核心对象) |
| 🔵 ai_synthesis | AI整合多个来源的综合 | 是(可选) |
| ✅ verified | 已经过校准确认 | 否 |
| ❌ rejected | 已被否定 | 否(但需要修订文档) |
D5:任务完成后的 Loop 反馈
本次执行产出:
- K-object 更新:碎片索引验证状态更新 + L1 文档🟡→✅标注修改
- S-object 追加:系统日志 + 待完成清单(否定类条目)
Loop 路由:
- 通路B(Loop 3 → Loop 2):发现被否定内容 → 追加到 todo.md → 等待 cognitive-update-knowledge 修订
- 系统完整性:随时间推移,🟡内容比例降低,🟢/✅内容比例上升,知识准确性持续提升
信号类型(A-G框架):
- 发现已否定内容(B类)≥ 3条 → G信号(结构性根因:🟡归因机制被过度使用,AI推断质量需要系统性改进)
- 所有内容已验证通过(A类)→ 通路A内部完成,无额外信号(知识准确性良好)
- 发现大量「⏸️无法验证」 → A信号(Skill改进:calibrate步骤可补充外部验证引导机制)
变更记录
v0.1 — 2026-03-23 — 从全量认知Skill规范.md Skill 13 复现
来源:会话 a55a4e9e(认知体系完善规划),全量规范 §Skill 13 路径映射:原 _内部总控/ 路径已替换为 cognitive/ 通用路径 状态:🟡 待审核(Gate A/B/C 尚未通过) 存放位置:pending-skills/(非正式部署区)