Evaluate
			
			 
		
		
				
			
			
			
			
				   
			 
		加入 Hugging Face 社区
		并获得增强的文档体验
		
				       
  
 
   🤗 Evaluate
 一个用于轻松评估机器学习模型和数据集的库。
 只需一行代码,您就可以访问数十种适用于不同领域(NLP、计算机视觉、强化学习等)的评估方法。无论是在您的本地机器上还是在分布式训练环境中,您都可以以一致且可复现的方式评估您的模型!
 请访问 🤗 Evaluate 组织页面,查看可用的完整指标列表。每个指标都有一个专属的 Space,其中包含关于如何使用该指标的交互式演示,以及一个详细说明指标局限性和用法的文档卡片。
 提示: 对于更近期的评估方法,例如评估大语言模型(LLM),我们推荐使用我们更新更积极、维护更活跃的库 LightEval。
  < > 在 GitHub 上更新   
			
			
		
 
				 
		 
		
		
		
	
  ©  . This site is unofficial and not affiliated with Hugging Face, Inc.