排行榜文档
为您的用例寻找最佳排行榜
加入 Hugging Face 社区
并获得增强的文档体验
开始使用
为您的用例寻找最佳排行榜
✨ 精选排行榜
自 2023 年底以来,我们与拥有丰富评估知识的合作伙伴合作,以博客系列的形式重点介绍他们的工作,该系列名为 Leaderboards on the Hub。
其中,您可以参考以下一些特定于大语言模型(LLM)的排行榜!
- 代码评估
- 数学能力
- 安全性
- 性能
这个系列对于理解不同模态和主题评估的微妙之处特别有趣,我们希望它将来能成为一个知识库。
🔍 自己探索空间
在 Hub 上,leaderboards 和 arenas 像机器学习演示一样,作为空间(Spaces)托管。
您可以在这里的搜索栏中通过空间标题搜索关键词 leaderboard 或 arena(或此链接),或者使用“全文搜索”在整个空间中搜索,也可以通过搜索 leaderboard 标签在此处寻找具有正确元数据的空间。
我们还努力维护一个及时更新的排行榜合集。如果我们遗漏了您的空间,请在空间讨论中@评估团队的任一成员!
< > 在 GitHub 上更新