name: db-doc description: 从数据库 schema 定义自动生成文档和 Mermaid ERD 图 triggers:

"生成数据库文档"
"database docs"
"generate erd"
"表结构文档"
"数据库 ERD"
"db documentation"

db-doc: 数据库文档与 ERD 自动生成器

触发条件

当用户提到以下关键词时激活：

"生成数据库文档"、"数据库文档"
"database docs"、"db docs"
"generate erd"、"数据库 ERD"
"表结构文档"、"table documentation"

功能概述

自动扫描项目中的数据库 schema 定义（migration 文件、DDL、ORM schema），生成：

Mermaid ERD 图（可直接在 GitHub/Markdown 渲染）
每张表的字段文档（Markdown 表格）
表关系说明（一对一、一对多、多对多）
输出到 docs/database.md

第一步：扫描项目，识别数据库 schema 来源

按优先级依次检测，找到即停：

1. Prisma

使用 Glob 工具搜索 **/schema.prisma，再搜索 **/prisma/*.prisma（排除 node_modules）。

Schema 位置通常为：prisma/schema.prisma

2. Drizzle

使用 Glob 工具依次搜索 **/drizzle/schema.ts、**/*.schema.ts、**/db/schema/*.ts（排除 node_modules）。

常见位置：src/db/schema/、drizzle/schema.ts

3. TypeORM

使用 Glob 工具搜索 **/*.entity.ts 和 **/entities/*.ts（排除 node_modules）。

如果未找到，使用 Grep 工具搜索包含 @Entity|@Table 的 .ts 文件（覆盖非标准目录结构）。

4. Supabase Migration

使用 Glob 工具搜索 **/supabase/migrations/*.sql。

5. Knex Migration

使用 Glob 工具搜索 **/migrations/*.{js,ts}（排除 node_modules）。

6. Django

使用 Glob 工具搜索 **/models.py（排除 venv/.venv），再搜索 **/migrations/*.py（排除 init.py 和 venv/.venv）。

7. Alembic (SQLAlchemy)

使用 Glob 工具搜索 **/alembic/versions/*.py 和 **/models/models.py（排除 venv/.venv）。

如果未找到，使用 Grep 工具搜索包含 declarative_base|DeclarativeBase 的 .py 文件（排除 venv/.venv），以检测 SQLAlchemy 2.0 声明式风格。

7a. Peewee ORM

使用 Grep 工具搜索包含 from peewee import 或 import peewee 的 .py 文件（排除 venv/.venv）。

7b. Tortoise ORM

使用 Grep 工具搜索包含 from tortoise 或 import tortoise 的 .py 文件（排除 venv/.venv）。

8. Go migrate

使用 Glob 工具搜索 **/migrations/*.up.sql 和 **/migrate/*.up.sql。

9. 纯 SQL DDL

使用 Glob 工具搜索 **/*.sql（排除 node_modules、.git、vendor、.venv）。

边界条件处理

未发现任何表定义 → 提示用户确认数据源位置
仅有 VIEW 无表 → 单独生成 VIEW 文档章节
全是 DROP 语句 → 警告"仅发现删除语句，可能不是当前 schema"
表名为 SQL 保留字 → 在文档中用反引号标注（如 order）
复杂外键约束（CASCADE/SET NULL） → 在关系描述中标注级联行为
虚拟列/计算列 → 标注 [GENERATED] 并记录计算表达式
分区表 → 标注分区策略和分区键
继承/表继承（PostgreSQL） → 标注父表关系

第二步：解析 Schema，提取表结构

需要提取的信息

对于每张表，提取以下字段信息：

属性	说明
字段名	column name
数据类型	原始类型 + 文档友好类型
是否可空	NOT NULL / nullable
默认值	DEFAULT 值
主键	PRIMARY KEY
唯一约束	UNIQUE
外键	REFERENCES → 目标表.字段
索引	INDEX 信息
描述	从注释或命名推断

SQL 类型 → 文档友好类型映射表

SQL 类型	文档类型	说明
`INTEGER`, `INT`, `INT4`, `SERIAL`	Integer	整数
`BIGINT`, `INT8`, `BIGSERIAL`	BigInt	大整数
`SMALLINT`, `INT2`	SmallInt	小整数
`REAL`, `FLOAT4`	Float	单精度浮点
`DOUBLE PRECISION`, `FLOAT8`	Double	双精度浮点
`NUMERIC`, `DECIMAL`	Decimal	精确小数
`BOOLEAN`, `BOOL`	Boolean	布尔值
`VARCHAR(n)`, `CHARACTER VARYING`	String(n)	变长字符串
`CHAR(n)`	Char(n)	定长字符串
`TEXT`	Text	长文本
`UUID`	UUID	唯一标识符
`TIMESTAMP`, `TIMESTAMPTZ`	Timestamp	时间戳
`DATE`	Date	日期
`TIME`, `TIMETZ`	Time	时间
`JSONB`, `JSON`	JSON	JSON 数据
`BYTEA`, `BLOB`	Binary	二进制数据
`ENUM(...)`	Enum	枚举类型
`ARRAY`	Array	数组类型
`INTERVAL`	Interval	时间间隔
`INT4RANGE`, `INT8RANGE`, `NUMRANGE`, `TSRANGE`, `TSTZRANGE`, `DATERANGE`	Range	范围类型
`LTREE`	LTree	层级路径标签
`TSVECTOR`	TSVector	全文搜索向量
`JSONPATH`	JSONPath	JSON 路径表达式

注意：特殊/方言特定类型（如 PostGIS 的 GEOMETRY、GEOGRAPHY 等）保持原名，不做映射转换。

Prisma 类型映射

Prisma 类型	文档类型
`String`	String
`Int`	Integer
`BigInt`	BigInt
`Float`	Float
`Decimal`	Decimal
`Boolean`	Boolean
`DateTime`	Timestamp
`Json`	JSON
`Bytes`	Binary

Drizzle 类型映射

Drizzle 函数	文档类型
`text()`	Text
`integer()`	Integer
`bigint()`	BigInt
`serial()`	Integer (auto)
`boolean()`	Boolean
`timestamp()`	Timestamp
`varchar()`	String
`json()` / `jsonb()`	JSON
`uuid()`	UUID
`real()`	Float
`doublePrecision()`	Double

第三步：判断表关系

关系类型判断规则

一对多 (1:N)

判断条件：表 B 有一个外键引用表 A 的主键

-- 示例：一个 user 有多个 posts
CREATE TABLE posts (
  id SERIAL PRIMARY KEY,
  user_id INTEGER REFERENCES users(id)  -- 外键 → 一对多
);

Prisma 示例：

model Post {
  author   User @relation(fields: [authorId], references: [id])
  authorId Int
}

一对一 (1:1)

判断条件：外键字段上有 UNIQUE 约束

-- 示例：一个 user 有一个 profile
CREATE TABLE profiles (
  id SERIAL PRIMARY KEY,
  user_id INTEGER UNIQUE REFERENCES users(id)  -- UNIQUE + 外键 → 一对一
);

Prisma 示例：

model Profile {
  user   User @relation(fields: [userId], references: [id])
  userId Int  @unique
}

多对多 (M:N)

判断条件：存在联接表（junction table），该表仅包含两个外键（加可选的自身主键和时间戳）

-- 示例：users 和 roles 多对多
CREATE TABLE user_roles (
  user_id INTEGER REFERENCES users(id),
  role_id INTEGER REFERENCES roles(id),
  PRIMARY KEY (user_id, role_id)  -- 联合主键 + 两个外键 → 多对多
);

识别联接表的特征：

表名通常为 tableA_tableB 或 tableA_to_tableB
仅有两个外键字段（可能加 id、created_at 等辅助字段）
两个外键分别指向不同的表

自引用关系

判断条件：外键引用同一张表

CREATE TABLE employees (
  id SERIAL PRIMARY KEY,
  manager_id INTEGER REFERENCES employees(id)  -- 自引用
);

第四步：生成 Mermaid ERD

Mermaid ERD 语法参考

erDiagram
    %% 表定义格式：TABLE_NAME { type field_name "comment" }
    USERS {
        uuid id PK "Primary key"
        varchar email UK "Unique email"
        varchar name "Display name"
        timestamp created_at "Creation time"
    }

    POSTS {
        uuid id PK "Primary key"
        uuid author_id FK "Author reference"
        text title "Post title"
        text content "Post body"
        timestamp created_at "Creation time"
    }

    TAGS {
        uuid id PK "Primary key"
        varchar name UK "Tag name"
    }

    POST_TAGS {
        uuid post_id FK "Post reference"
        uuid tag_id FK "Tag reference"
    }

    %% 关系格式：TABLE_A relationship TABLE_B : "label"
    %% ||--o{ = 一对多 (one to many)
    %% ||--|| = 一对一 (one to one)
    %% }o--o{ = 多对多 (many to many)
    %% |o--o{ = 零或一对多

    USERS ||--o{ POSTS : "has many"
    POSTS ||--o{ POST_TAGS : "has many"
    TAGS ||--o{ POST_TAGS : "has many"

Mermaid 关系符号速查

注意：下表中的 \| 仅为 Markdown 表格转义，实际 Mermaid 代码中使用 |（无反斜杠）。

符号	含义
`\|\|--o{`	一对多 (one-to-many)
`\|\|--\|\|`	一对一 (one-to-one)
`}o--o{`	多对多 (many-to-many)
`\|o--o{`	零或一对多
`o\|--\|\|`	零或一对一

字段标记

标记	含义
`PK`	Primary Key
`FK`	Foreign Key
`UK`	Unique Key

Mermaid 字段标记规则

Mermaid erDiagram 每个字段只能有一个标记（PK/FK/UK），当冲突时：

冲突场景	处理方案	说明
PK + FK	使用 PK 标记	在 comment 中标注 "FK → target_table.column"
PK + UK	使用 PK 标记	PK 天然唯一，无需额外标注
FK + UK	使用 FK 标记	在 comment 中标注 "UNIQUE"

示例：

erDiagram
  orders {
    uuid id PK "主键"
    uuid user_id FK "FK → users.id, UNIQUE"
  }

大型数据库处理（超过 15 张表）

当表数量较多时，按以下策略自动分组：

分组算法

按表名前缀自动分组：提取表名中 _ 前的第一段作为分组 key
- 例如 auth_users、auth_roles、auth_permissions → auth 组
- 例如 order_items、order_payments → order 组
按外键关联度聚类：将有直接外键关联的表归入同一组，优先级高于前缀分组
每组 ERD 限制 15 张表以内：超出时按关联紧密度拆分子组
跨组关系用注释标注（如 %% 关联外部表：auth.users）
生成一个概览 ERD（仅表名和主要关系，不含字段详情）

分组示例

假设数据库有 30 张表：

分组	表	依据
`auth`	`auth_users`, `auth_roles`, `auth_permissions`, `auth_sessions`	表名前缀
`order`	`orders`, `order_items`, `order_payments`, `order_refunds`	表名前缀 + 外键关联
`product`	`products`, `product_categories`, `product_images`, `inventory`	前缀 + `inventory` 通过外键聚入
`notification`	`notifications`, `notification_templates`, `notification_logs`	表名前缀

多 Schema 支持

如果表名包含 schema 前缀（如 auth.users），保留前缀
ERD 中用 Mermaid 注释分隔不同 schema
跨 schema 外键正常标注关系

第五步：生成字段文档

Markdown 表格模板

对每张表生成如下文档：

### `users` 表

用户信息表，存储系统用户的基本资料。

| 字段名 | 类型 | 可空 | 默认值 | 约束 | 描述 |
|--------|------|------|--------|------|------|
| `id` | UUID | NO | `gen_random_uuid()` | PK | 主键 |
| `email` | String(255) | NO | - | UNIQUE | 用户邮箱 |
| `name` | String(100) | YES | `NULL` | - | 显示名称 |
| `role` | Enum(admin,user) | NO | `'user'` | - | 用户角色 |
| `created_at` | Timestamp | NO | `now()` | - | 创建时间 |
| `updated_at` | Timestamp | NO | `now()` | - | 更新时间 |

**索引：**
- `idx_users_email` — UNIQUE on `email`
- `idx_users_created_at` — BTREE on `created_at`

关系说明模板

## 表关系

| 关系 | 类型 | 说明 |
|------|------|------|
| `users` → `posts` | 一对多 | 一个用户可以创建多篇文章 |
| `users` → `profiles` | 一对一 | 一个用户对应一个详细资料 |
| `users` ↔ `roles` | 多对多 | 通过 `user_roles` 联接表关联 |
| `categories` → `categories` | 自引用 | 通过 `parent_id` 实现树形分类 |

第六步：增量更新 vs 全量生成

判断逻辑

IF docs/database.md 不存在:
    → 全量生成
ELIF docs/database.md 存在:
    → 读取现有文档
    → 解析已有的表列表
    → 对比当前 schema 与文档中的表
    → 仅更新变更部分：
        - 新增的表 → 追加到文档末尾（ERD + 表格）
        - 删除的表 → 从文档中移除（提示用户确认）
        - 修改的表 → 更新对应表的字段文档
        - 新增/删除的关系 → 更新关系表和 ERD
    → 保留用户在文档中手动添加的描述和注释

增量更新策略

使用 HTML 注释标记区分自动生成和用户自定义内容：

<!-- AUTO-GENERATED-BEGIN: table_users -->
### users 表
| 字段 | 类型 | 说明 |
| ... | ... | ... |
<!-- AUTO-GENERATED-END: table_users -->

<!-- 以下为用户自定义内容，增量更新时保留 -->
> 业务说明：用户表存储核心用户信息...

增量更新规则：

仅修改 AUTO-GENERATED-BEGIN 和 AUTO-GENERATED-END 之间的内容
保留标记范围外的所有用户自定义内容
新增表 → 追加新的标记区块
删除表 → 将标记区块内容替换为 [已删除] 标注，保留 30 天后可清理
更新前 → 自动备份为 database.md.bak

增量更新时的其他注意事项

标记变更：在更新日志部分记录本次变更
ERD 重新生成：ERD 图需要完整重新生成（因为 Mermaid 不支持局部更新）
变更摘要：在文档顶部添加最近一次更新的摘要

变更标记方式

增量更新时，使用以下标记清晰标注变更内容：

新增表：表标题添加 [NEW] 前缀，如 ### [NEW] \notifications` 表`
删除表：用删除线标注，如 ### ~~\legacy_logs` 表~~`，并在描述中注明删除原因
变更字段：在字段描述列添加 [CHANGED] 标记，如 邮箱地址 [CHANGED]
文档顶部变更摘要：在 Change Log 下方添加最近一次变更的详细摘要

## Recent Changes Summary

**2024-01-20 更新摘要：**
- [NEW] 新增 `notifications` 表（3 个字段）
- [CHANGED] `users` 表：`email` 字段长度从 VARCHAR(100) 改为 VARCHAR(255)
- [DELETED] 移除 `legacy_logs` 表

文档头部模板

# Database Documentation

> Auto-generated by db-doc skill. Last updated: YYYY-MM-DD HH:mm

## Change Log

| Date | Changes |
|------|---------|
| 2024-01-15 | Initial generation: 8 tables, 12 relationships |
| 2024-01-20 | Added `notifications` table, updated `users` table |

第七步：输出完整文档

文档结构

# Database Documentation

> Auto-generated by db-doc skill. Last updated: YYYY-MM-DD HH:mm

## Change Log
...

## Entity Relationship Diagram

```mermaid
erDiagram
    ...
```

## Tables

### `table_name` 表
...（每张表的字段文档）

## Relationships

| 关系 | 类型 | 说明 |
...

## Indexes

| 表名 | 索引名 | 类型 | 字段 |
...

输出位置

默认输出到：docs/database.md
如果 docs/ 目录不存在，先创建
如果文件已存在，按增量更新逻辑处理
文件冲突处理：如果 docs/database.md 已存在且非本工具生成（缺少 AUTO-GENERATED 标记），提示用户选择：
- 覆盖现有文件
- 输出到备选路径 docs/database-schema.md 以避免冲突

质量检查清单

生成文档后，逐项检查：

完整性：所有表都已包含在文档中
ERD 语法：Mermaid ERD 代码语法正确，可以渲染
关系准确：所有外键关系都已正确标注类型（1:1, 1:N, M:N）
字段完整：每张表的所有字段都已列出
类型映射：数据类型已转换为文档友好类型
约束标注：PK、FK、UNIQUE、NOT NULL 标注正确
默认值：有默认值的字段已标注
索引记录：所有索引已记录
联接表识别：多对多关系的联接表已正确识别
自引用检测：自引用关系已正确标注
无遗漏外键：所有 REFERENCES / @relation 都已转换为关系
描述合理：字段描述从命名推断合理（如 created_at → "创建时间"）
变更日志：如果是增量更新，变更日志已更新
Markdown 格式：表格对齐，代码块正确闭合

常见字段名 → 描述推断表

字段名模式	推断描述
`id`	主键
`*_id`	外键引用
`created_at`	创建时间
`updated_at`	更新时间
`deleted_at`	软删除时间
`email`	邮箱地址
`name` / `title`	名称/标题
`description` / `desc`	描述说明
`status`	状态字段（需根据业务上下文补充具体含义）
`type` / `kind`	类型/分类字段（需根据业务上下文补充具体含义）
`is_` / `has_`	布尔标记（需根据业务上下文补充具体含义）
`count` / `*_count`	计数（需根据业务上下文补充具体含义）
`amount` / `price` / `total`	金额（需根据业务上下文补充具体含义）
`url` / `*_url`	URL 链接
`path` / `*_path`	文件路径
`avatar` / `image` / `photo`	图片
`password` / `password_hash`	密码（哈希）
`token` / `*_token`	令牌
`slug`	URL 友好标识
`sort_order` / `position`	排序位置
`parent_id`	父级引用（树形结构）
`metadata` / `meta`	元数据
`config` / `settings`	配置信息

注意：标注"需根据业务上下文补充具体含义"的字段，其推断描述较为通用，建议用户在生成后根据实际业务语义手动调整。

ナビゲーション

Skillsとは？

リンク

db-doc