Lighteval 文档

Lighteval

Hugging Face's logo
加入 Hugging Face 社区

并获得增强的文档体验

开始使用

Lighteval

🤗 Lighteval 是您的一体化工具包,用于在多个后端轻松评估大语言模型 (LLM)——无论是 transformerstgi推理提供者vllm 还是 nanotron。通过保存和探索详细的、逐样本的结果,深入了解您的模型性能,以进行调试并查看您的模型表现如何。

定制化触手可及:让您能够轻松创建新任务指标以满足您的需求,或浏览我们所有现有的任务和指标。

在 Hugging Face Hub、S3 或本地无缝地进行实验、基准测试和存储结果。

< > 在 GitHub 上更新