> ## Documentation Index
> Fetch the complete documentation index at: https://niceeval.com/docs/llms.txt
> Use this file to discover all available pages before exploring further.

# 为你的 Agent 项目设置评估

这个教程会从零开始创建一个最小 niceeval 项目，并展示三种常见 eval：进程内函数、对话 agent、沙箱里的 coding agent。

如果你已经知道自己要评什么，可以直接从对应场景开始：

<CardGroup cols={3}>
  <Card title="如果你需要 eval 你的 Claude Code / Codex 插件" icon="plug" href="/zh/example/claude-code-codex-plugin">
    适合插件、Hook、MCP server 和项目级 coding-agent 扩展。
  </Card>

  <Card title="如果你需要 eval 你的 Claude Code / Codex Skill" icon="wand-magic-sparkles" href="/zh/example/claude-code-codex-skill">
    适合验证 Skill 是否被触发、是否按流程执行、是否真的提升任务成功率。
  </Card>

  <Card title="如果你需要 eval 你的 AI Agent 应用" icon="globe" href="/zh/example/ai-agent-application">
    适合 HTTP agent、AI SDK、LangGraph、Pi 或自研 agent 服务。
  </Card>
</CardGroup>

也可以把下面的指令直接交给你的 coding agent：

<Steps>
  <Step title="安装">
    ```text theme={null}
    READ https://raw.githubusercontent.com/CorrectRoadH/niceeval/refs/heads/main/INIT.md and install niceeval for this repo.

    ```
  </Step>

  <Step title="运行测试">
    ```bash theme={null}
    pnpm exec niceeval exp 实验名
    ```
  </Step>

  <Step title="查看结果">
    ```text theme={null}
    npx niceeval view
    ```
  </Step>
</Steps>

## 放进 CI

```yaml theme={null}
name: evals
on: [pull_request]
jobs:
  evals:
    runs-on: ubuntu-latest
    steps:
      - uses: actions/checkout@v4
      - uses: actions/setup-node@v4
      - run: npm ci
      - run: npx niceeval exp ci --sandbox docker --strict
```

<Tip>
  接下来读 [编写 eval](/zh/guides/authoring) 和 [评分指南](/zh/guides/scoring-guide)，把示例替换成你的真实场景。
</Tip>
