使用 AutoTrain 进行图像分类
你已经听说过机器学习世界里发生的各种酷炫事情,也想加入进来。但只有一个问题——你不会编码!😱 或者,你可能是一位经验丰富的软件工程师,想在你的业余项目中添加一些机器学习功能,但又没有时间学习一整套新的技术栈!对于许多人来说,学习机器学习的技术障碍感觉是无法逾越的。这就是 Hugging Face 创建 AutoTrain 的原因,而且随着我们刚刚添加的最新功能,我们正在让“无代码”机器学习变得前所未有的出色。最棒的是,你可以免费创建你的第一个项目!✨
Hugging Face AutoTrain 让你能够以零配置要求训练模型。只需选择你的任务(翻译?还是问答?),上传你的数据,然后让 Hugging Face 完成剩下的工作!通过让 AutoTrain 尝试多种不同的模型,你甚至很有可能得到一个比工程师手动训练的模型表现更好的模型🤯 我们一直在扩展支持的任务数量,我们很自豪地宣布,你现在可以使用 AutoTrain 进行计算机视觉任务!图像分类是我们最新添加的任务,未来还会增加更多。但这对你意味着什么呢?
图像分类模型学习对图像进行分类,这意味着你可以训练这些模型来标记任何图像。你想要一个能识别签名的模型吗?能区分鸟类物种的模型?能识别植物疾病的模型?只要你能找到合适的数据集,图像分类模型就能满足你的需求。
如何训练自己的图像分类器?
如果你还没有创建 Hugging Face 账户,现在就是时候了!之后,前往 AutoTrain 主页并点击“创建新项目”开始。系统会要求你填写一些关于你项目的基本信息。在下面的截图中,你会看到我创建了一个名为 butterflies-classification
的项目,并选择了“图像分类”任务。我还选择了“自动”模型选项,因为我想让 AutoTrain 为我的项目寻找最佳的模型架构。
一旦 AutoTrain 创建了你的项目,你只需连接你的数据。如果你的数据在本地,你可以将文件夹拖放到窗口中。由于我们也可以使用 Hugging Face Hub 上的任何图像分类数据集,在这个例子中,我决定使用 NimaBoscarino/butterflies 数据集。你可以选择单独的训练集和验证集(如果可用),或者让 AutoTrain 为你分割数据。
添加数据后,只需选择你希望 AutoModel 尝试的模型候选数量,查看预期的训练成本(训练 5 个候选模型且图像少于 500 张是免费的🤩),然后开始训练!
在上面的截图中,你可以看到我的项目启动了 5 个不同的模型,每个模型都达到了不同的准确率分数。其中一个模型的表现非常不好,所以 AutoTrain 停止了它,以免浪费资源。表现最好的模型达到了 84% 的准确率,而我几乎没有付出任何努力 😍 最后,你可以访问你在 Hub 上新训练的模型,并通过集成的推理小部件进行操作。例如,请查看我在NimaBoscarino/butterflies 🦋 上的蝴蝶分类器模型
我们非常期待看到你用 AutoTrain 构建什么!别忘了加入 hf.co/join/discord 的社区,如果你需要任何帮助,请联系我们 🤗