目录结构
| 文件 | 作用 |
|---|---|
PROMPT.md | 发给 agent 的任务 |
EVAL.ts | 验证测试,agent 完成后才出现 |
package.json | fixture 的依赖和脚本 |
src/ | 初始 workspace |
PROMPT.md
EVAL.ts
运行 fixture
验证 agent 行为
niceeval 会把 o11y 摘要注入__niceeval__/results.json,EVAL.ts 可以检查 agent 是否调用了预期命令:
何时用 fixture
- 需要 agent 修改真实文件。
- 需要运行项目测试、构建或 lint。
- 需要比较生成 diff。
- 任务适合批量收集 pass rate。
defineEval 更轻。