defineConfig 从根目录的 niceeval.config.ts 默认导出,只放项目级默认值。agent、model、flags、runs 和实验预算写在 experiments/ 下的 defineExperiment 文件里。
t.judge.autoevals.* 的默认评判模型和端点。额外 reporter。临时生成 JUnit 可用 CLI 的
--junit <path>。最大并发 attempt 数。
单个 attempt 的超时时间,单位毫秒。
默认 sandbox 后端。起始文件不会自动上传;sandbox eval 在
test(t) 里调用 t.sandbox.uploadDirectory(...)、uploadFiles(...) 或 writeFiles(...)。test(t),agent 自己的准备写在 adapter 的 setup。