Evaluate 文档
🤗 Evaluate
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
🤗 Evaluate
一个用于轻松评估机器学习模型和数据集的库。
只需一行代码,您就可以访问数十种适用于不同领域(NLP、计算机视觉、强化学习等)的评估方法。无论是在您的本地机器上还是在分布式训练环境中,您都可以以一致且可复现的方式评估您的模型!
请访问 🤗 Evaluate 组织页面,查看可用的完整指标列表。每个指标都有一个专属的 Space,其中包含关于如何使用该指标的交互式演示,以及一个详细说明指标局限性和用法的文档卡片。
提示: 对于更近期的评估方法,例如评估大语言模型(LLM),我们推荐使用我们更新更积极、维护更活跃的库 LightEval。
< > 在 GitHub 上更新