阿拉伯语LLM模型
社区文章 发布于2025年3月4日

阿拉伯语LLM模型生态系统正在迅速扩展,这给跟上最新发展带来了挑战。本文旨在通过提供一个持续更新新阿拉伯语LLM模型的综合资源来解决这个问题,为用户提供必要的信息和链接,以选择最适合其特定任务的模型。这份动态文档将成为您所有阿拉伯语LLM模型需求的首选资源。
选择标准
要包含一个模型,以下 任一条件 必须为真:
- 模型是开源的
- 模型可以通过在线链接试用
- 模型以API形式提供
通用模型
以下是通用阿拉伯语模型列表(顺序不代表性能)
RAG优化模型
以下是为RAG生成用例训练和优化的模型列表
名称 | 大小 | 许可证 | 链接 | 评论 |
---|---|---|---|---|
SILMA Kashif v1.0 | 2B | 开放权重 (Gemma) | https://huggingface.co/silma-ai/SILMA-Kashif-2B-Instruct-v1.0 | 基准测试 |
Cohere command-r7b-arabic | 8B | 开放权重 (CC 非商业 4.0) | https://huggingface.co/CohereForAI/c4ai-command-r7b-arabic-02-2025 | 通用+针对RAG优化 |
视觉与OCR
以下是具有多模态能力(视觉、文本等)的模型列表
名称 | 大小 | 许可证 | 链接 | 评论 |
---|---|---|---|---|
AIN | 8B | 开放权重 (MIT) | https://huggingface.co/MBZUAI/AIN | 基于Qwen |
Qari OCR | 2B | 开放权重 (Apache 2.0) | https://huggingface.co/NAMAA-Space/Qari-OCR-0.1-VL-2B-Instruct | 基于Qwen。仅OCR |
Cohere aya-vision | 8B-32B | 开放权重 (CC 非商业 4.0) | https://huggingface.co/collections/CohereForAI/c4ai-aya-vision-67c4ccd395ca064308ee1484 |
方言优化模型 - 叙利亚阿拉伯语
针对黎凡特方言优化的模型
名称 | 大小 | 许可证 | 链接 | 评论 |
---|---|---|---|---|
Shahin-v0.1 | 14B | 开放权重 (Apache 2.0) | https://huggingface.co/malhajar/Shahin-v0.1 | 基于Qwen |
方言优化模型 - 摩洛哥阿拉伯语
为摩洛哥口语阿拉伯语Darija调整的模型
名称 | 大小 | 许可证 | 链接 | 评论 |
---|---|---|---|---|
Atlas-Chat | 9B-27B | 开放权重 (Gemma) | https://huggingface.co/MBZUAI-Paris/Atlas-Chat-9B | 基于Gemma |
方言优化模型 - 突尼斯阿拉伯语
为突尼斯阿拉伯语调整的模型
名称 | 大小 | 许可证 | 链接 | 评论 |
---|---|---|---|---|
Labess Chat | 7B | 开放权重 (apache-2.0) | https://huggingface.co/linagora/Labess-7b-chat | 基于Jais |
缺少模型?
如果您认为某个模型未包含在列表中,请在下方留言。如果它符合必要的标准,将被添加。
如何选择模型?
除了在实际用例中测试模型外,基准测试对于评估模型性能的各个方面也很有价值。
以下文章包含阿拉伯语AI基准列表 https://huggingface.co/blog/silma-ai/arabic-ai-benchmarks-and-leaderboards