S1 过滤前后对比

源:2026-04-16 12:00 那次 run.sh 全流程的 batch1 / batch2

文件charsbytes说明
batch1_S1_input.txt 99,808134K 大批 输入(对话原文)
batch1_S1_output.txt 11,93016K 过滤后 保留 12%,耗时 545s
batch2_S1_input.txt 14,98019K 小批输入
batch2_S1_output.txt 7,53212K 过滤后 保留 50%,耗时 146s

Side-by-side 对比

batch1 对比(大批,12%) batch2 对比(小批,50%)

关键发现

  1. 大批删过头:batch1 保留 12%,batch2 保留 50%。同样的 prompt,输入越大 sonnet 删得越狠
  2. 非线性超时:输入 7x 大,耗时 3.7x(rate limit 排队)
  3. log 记录 bug:extract.log 说 batch2 输出 3946 chars,实际 7532 chars