OpenAI Evals — 架构与原理OpenAI Evals — 模型当裁判(LLM-as-judge)本页总览03 · 模型当裁判(LLM-as-judge) 本章讲 Evals 最有借鉴价值的一块:当答案是开放式(摘要、解释、翻译)、没法字符串比对时,怎么"让另一个模型来打分",并且把它的打分逼成机器可解析的形式。 1. 这一章要解决的问题