mistral.rs v0.5.0

社区文章发布于2025年3月24日

我们很高兴地宣布 mistral.rs v0.5.0 发布，它带来了许多激动人心的新功能，让 LLM 推理变得更轻松、更快速！

感谢所有为此次发布做出贡献的人。此次发布包括以下亮点，以及无数的改进、修复和优化：

此版本扩大了对模型的支持，使从低端到高端的所有用户都可以在同一个推理平台中工作。用户可以在本地构建其应用程序，然后将其部署到集群中！

我们还为 Metal 设备实施了许多优化！结果如下。

Metal 与 llama.cpp、MLX 的对比

将 T/s 与 llama.cpp 和 MLX v0.24.0 进行比较显示，mistral.rs v0.5.0 在 Metal 上的性能非常相似。您可以在此处重现这些结果。

这些测试是在 M3 Max 机器上进行的。

Llama 3.2 3b，8位

Llama 3.1 8b，8位

很高兴你们发布了！

干得好！

我想问一下，你为什么认为它比 llama.cpp 和 mlx 慢？瓶颈在哪里？Metal 内核在两个项目中都是开源的（MIT 许可证），所以我不认为是因为缺少内核实现。

通过拖放到文本输入框、粘贴或点击此处上传图片、音频和视频。

点击或粘贴此处以上传图片

· 注册或登录进行评论