欢迎 PaddlePaddle 加入 Hugging Face Hub
我们很高兴地宣布 Hugging Face 与 PaddlePaddle 达成开源合作,共同致力于通过开源推动人工智能的进步和普及!
PaddlePaddle 于 2016 年由百度首次开源,它使得各种技能水平的开发者都能够大规模地采用和实现深度学习。截至 2022 年第四季度,PaddlePaddle 已被超过 535 万开发者和 20 万家企业使用,在中国深度学习平台市场份额中排名第一。PaddlePaddle 拥有许多受欢迎的开源仓库,例如 Paddle 深度学习框架、跨不同模态的模型库(例如 PaddleOCR、PaddleDetection、PaddleNLP、PaddleSpeech)、用于模型压缩的 PaddleSlim、用于模型部署的 FastDeploy 等等。
以 PaddleNLP 为先导,PaddlePaddle 将逐步将其库与 Hugging Face Hub 集成。 您很快就能在 Hub 上玩转全套出色的 PaddlePaddle 预训练模型,涵盖文本、图像、音频、视频和多模态!
查找 PaddlePaddle 模型
您可以通过 PaddlePaddle 库标签 过滤,在模型中心找到所有 PaddlePaddle 模型。
目前 Hub 上已有超过 75 个 PaddlePaddle 模型。例如,您可以找到我们的多任务信息抽取模型系列 UIE,最先进的中文语言模型 ERNIE 3.0 模型系列,在整个工作流程中强化布局知识的新颖文档预训练模型 Ernie-Layout 等等。
也欢迎您访问 HuggingFace Hub 上的 PaddlePaddle 组织。除了上述模型,您还可以探索我们的 Spaces,包括我们的文本到图像模型 Ernie-ViLG、跨模态信息抽取引擎 UIE-X 以及出色的多语言 OCR 工具包 PaddleOCR。
推理 API 和 小部件
PaddlePaddle 模型可通过 推理 API 使用,您可以通过 cURL、Python 的 requests 库或您首选的网络请求方法以 HTTP 方式访问该 API。
支持 任务 的模型都配备了交互式小部件,让您可以在浏览器中直接操作模型。
使用现有模型
如果您想查看如何加载特定模型,可以点击 Use in paddlenlp
(或将来其他 PaddlePaddle 库),您将获得一段可用的代码片段来加载它!
分享模型
根据 PaddlePaddle 库的不同,您可以通过推送到 Hub 来分享您的模型。例如,您可以使用 save_to_hf_hub
方法分享 PaddleNLP 模型。
from paddlenlp.transformers import AutoTokenizer, AutoModelForMaskedLM
tokenizer = AutoTokenizer.from_pretrained("PaddlePaddle/ernie-3.0-base-zh", from_hf_hub=True)
model = AutoModelForMaskedLM.from_pretrained("PaddlePaddle/ernie-3.0-base-zh", from_hf_hub=True)
tokenizer.save_to_hf_hub(repo_id="<my_org_name>/<my_repo_name>")
model.save_to_hf_hub(repo_id="<my_org_name>/<my_repo_name>")
结论
PaddlePaddle 是一个源自工业实践的开源深度学习平台,自 2016 年以来一直在开源创新和工业级项目。我们很高兴加入 Hub,与 HuggingFace 社区分享我们的工作,您可以期待我们很快推出更多有趣且最先进的项目!如需了解最新消息,您可以在 Twitter 上关注我们:@PaddlePaddle。