Lighteval 文档

Lighteval

Hugging Face's logo
加入 Hugging Face 社区

并获取增强的文档体验

开始使用

Lighteval

🤗 Lighteval 是您用于评估跨多个后端的 LLM 的一体化工具包——无论是 transformerstgi推理 providersvllm 还是 nanotron,都能轻松应对。通过保存和探索详细的、逐个样本的结果来深入了解您的模型性能,以便调试并了解您的模型表现如何。

触手可及的自定义:让您轻松创建 新任务指标 以满足您的需求,或者浏览我们所有现有的任务和指标。

在 Hugging Face Hub、S3 或本地无缝实验、基准测试和存储您的结果。

< > GitHub 上更新