docs: centralize word count compliance workflow

This commit is contained in:
fangshuyu
2026-07-02 13:17:34 +08:00
parent e5b9f7c8c5
commit 18250d61a7
3 changed files with 12 additions and 20 deletions

View File

@@ -36,6 +36,15 @@ lark-cli docs +fetch --doc "$URL" --doc-format xml --detail full --format json \
如果 `unknown_blocks``unsupported_blocks` 非空,回复用户时要说明“已统计可提取文本,但存在未覆盖块,结果可能偏低”,并列出对应块类型。为空时可直接给出结果。
## 字数遵循校验
当用户给了明确字数要求(写 N 字 / x-y 字 / x 字左右 / 上下浮动)时执行;没有明确字数要求则跳过。字数必须按本文流程用脚本统计,不要自己估。
1. 把要求归一成目标区间:`>x``[x, +∞)``<y``(-∞, y]``x-y``[x, y]``x 字左右``[round(0.9x), round(1.1x)]`
2. 按上方「调用方式」统计实际字数,读取输出里的 `word_count`
3. 对比 `word_count` 与目标区间:区间内即通过;低于下限 → 补充**实质内容**(非注水);高于上限 → 删减冗余内容。改完重新统计
4. **最多 2 轮**。2 轮后仍不达标:停止,不得为达标而注水或删关键内容;如实汇报【目标区间 / 当前字数 / 差值与方向 / 已试 2 轮 / 未达原因】,**禁止谎称达标**
## 输出示例
输入正文等价于:`标题` + `一个苹果是 an apple。` 时,输出形态如下:

View File

@@ -41,19 +41,11 @@
- **查组件**:高亮块 / 分栏 / 画板 / 颜色是否克制、符合体裁。
6. **画板识别**:逐章节扫描,判断是否有段落用图明显比文字更易懂(流程 / 架构 / 时间线 / 对比 / 占比等,见 `lark-doc-style.md` 的画板原则。默认用文字只有确需图示才记录需要插图的章节、推荐画板类型、mermaid/SVG 路径和用于画图的源内容
### 步骤三:画板处理润色
### 步骤三:画板处理润色与校验
7. **优先处理步骤二识别出的画板需求**:参考 [lark-doc-whiteboard.md](../lark-doc-whiteboard.md) 中的方式插入图表画板。画板渲染仍隔离到 SubAgent见下方「画板 SubAgent 子任务要求」),正文本身不交给子 Agent
8. 由**主 Agent 自行润色**(不另起内容子 Agent正文始终一人维护文字密集且不易读时优先拆段、加小标题或调整顺序——叙述内容保持成段**不要默认改成列表**,只有确属并列要点 / 步骤才用列表(见 `lark-doc-style.md`);只有确实存在行列数据时才用 `<table>`。其余富 block 的取舍一律遵循 `lark-doc-style.md` 的写作原则,不主动堆叠。需要明显分隔的主题可补充 `<hr/>`,不强制章节间都使用。本地图片使用 `docs +media-insert` 插入
### 步骤四:字数校验(无明确字数要求则跳过)
**仅当**用户给了明确字数要求(写 N 字 / x-y 字 / x 字左右 / 上下浮动)时执行;否则**跳过本步**。字数必须用脚本统计,不要自己估。
1. 把要求归一成目标区间:`>x``[x, +∞)``<y``(-∞, y]``x-y``[x, y]``x 字左右``[round(0.9x), round(1.1x)]`
2. 按 [`lark-doc-word-stat.md`](../lark-doc-word-stat.md) 统计文档 URL 或 token 对应文档的实际字数,读取输出里的 `word_count`
3. 对比 `word_count` 与目标区间:区间内即通过;低于下限 → 在最该展开的节补**实质内容**(非注水);高于上限 → 从最长 / 最冗余处删减。改完**重新按同一流程统计**
4. **最多 2 轮**。2 轮后仍不达标:停止,不得为达标而注水或删关键内容;如实汇报【目标区间 / 当前字数 / 差值与方向 / 已试 2 轮 / 未达原因】并交付文档链接,**禁止谎称达标**
9. 按 [`lark-doc-word-stat.md`](../lark-doc-word-stat.md) 的「字数遵循校验」判断是否执行并完成闭环
## Agent 子任务要求

View File

@@ -46,16 +46,7 @@
- **查呈现**:成行成列的数据是否该用表格却写成了段落 / "A+B+C"串?"小标题 + 一句话"的小项是否被升成了标题?是则按 `lark-doc-style.md` §二改成表格 / 标签行 / 加粗引导句段落。
- **查组件**:高亮块 / 分栏 / 画板 / 颜色是否克制、符合体裁。
修正后向用户呈现结果。
### 步骤四:字数校验(无明确字数要求则跳过)
**仅当**用户给了明确字数要求(写 N 字 / x-y 字 / x 字左右 / 上下浮动)时执行;否则**跳过本步**。字数必须用脚本统计,不要自己估。
1. 把要求归一成目标区间:`>x``[x, +∞)``<y``(-∞, y]``x-y``[x, y]``x 字左右``[round(0.9x), round(1.1x)]`
2. 按 [`lark-doc-word-stat.md`](../lark-doc-word-stat.md) 统计文档 URL 或 token 对应文档的实际字数,读取输出里的 `word_count`
3. 对比 `word_count` 与目标区间:区间内即通过;低于下限 → 在最该展开处补**实质内容**(非注水);高于上限 → 从最长 / 最冗余处删减。改完**重新按同一流程统计**
4. **最多 2 轮**。2 轮后仍不达标:停止,不得为达标而注水或删关键内容;如实汇报【目标区间 / 当前字数 / 差值与方向 / 已试 2 轮 / 未达原因】并交付文档链接,**禁止谎称达标**
9. 按 [`lark-doc-word-stat.md`](../lark-doc-word-stat.md) 的「字数遵循校验」判断是否执行并完成闭环。修正后向用户呈现结果。
## 画板 SubAgent 子任务要求