退出码
默认情况下,只要存在失败的 gate,niceeval 将以非零状态码退出。CI 中通常使用--strict,让失败更明确。
GitHub Actions 示例
配置 secrets
JUnit reporter
只检查发现
缓存 .niceeval/
可以在 CI 中缓存 .niceeval/,但要确保 fingerprint 覆盖了影响结果的输入。对于 nightly 基准,通常保留完整 artifacts 更有价值。
控制并发
推荐模式
PR runs
只跑关键 eval 和高风险路径,保持反馈快。
Nightly 全量矩阵运行
运行完整 experiment,记录 pass rate、成本和延迟趋势。