推出 UNA-斗牛犬系列

社区文章发布于 2024 年 6 月 1 日

我们很高兴宣布发布最新模型 UNA-ThePitbull，这是业界 70B 以下最强大的模型。在新一代模型中，我们从之前的 Beagle 系列中汲取灵感，精心设计了一个在情商和智商之间取得良好平衡的模型。它采用了一些最新的数据集进行训练，包括：

可在 Hugging Face Hub 上获取 fblgit/UNA-ThePitbull-21.4B-v2，您还可以从 @bartowski 赞助的 Quant 版本处获取，地址为 bartowski/UNA-ThePitbull-21.4B-v2-GGUF，完全兼容 Ollama、llama.cpp 等。

评估

详细的评估结果可在此处找到：此处

在这种情况下，我们尝试了一些新方法，通过交替 MLP 和 Attention 层的均匀性，在保持高性能结果的同时降低了计算要求。

我们根据以下条款对其进行了训练：

您可以继续训练，只需使用 5e-5 的最大学习率和 0 个预热步骤，这样可以最大限度地减少模型的灾难性遗忘。

请记住，如果您这样做，请在您的模型中包含一张斗牛犬图片并引用 :) 玩得开心！

通过拖放到文本输入框、粘贴或点击此处上传图片、音频和视频。

点击或粘贴此处以上传图片

· 注册或登录发表评论