Hugging Face
模型
数据集
Spaces
帖子
文档
企业版
定价
登录
注册
Learn
TRL 文档
Liger Kernel 集成
TRL
🏡 查看所有文档
AWS Trainium & Inferentia
Accelerate
Amazon SageMaker
Argilla
AutoTrain
Bitsandbytes
聊天界面
竞赛
数据集查看器
数据集
Diffusers
Distilabel
Evaluate
Gradio
Hub
Hub Python 库
Hugging Face Generative AI Services (HUGS)
Huggingface.js
推理端点 (专用)
推理提供商
排行榜
Lighteval
Optimum
PEFT
Safetensors
Sentence Transformers
TRL
任务
文本嵌入推理
文本生成推理
分词器
Transformers
Transformers.js
smolagents
timm
搜索文档
main
v0.16.1
v0.15.2
v0.14.0
v0.13.0
v0.12.2
v0.11.4
v0.10.1
v0.9.6
v0.8.6
v0.7.11
v0.6.0
v0.5.0
v0.4.7
v0.3.1
v0.2.1
v0.1.1
简中
入门指南
TRL
安装
快速开始
概念指南
数据集格式
训练常见问题解答
理解日志
操作指南
命令行界面 (CLI)
自定义训练
减少内存使用
加速训练
分布式训练
使用已训练模型
集成
DeepSpeed
Liger Kernel
PEFT
Unsloth
示例
示例概览
社区教程
情感调优
训练 StackLlama
去除语言模型毒性
学习使用工具
多适配器 RLHF
API
训练器
AlignProp
BCO
CPO
DDPO
DPO
Online DPO
GKD
GRPO
KTO
Nash-MD
ORPO
PPO
PRM
Reward
RLOO
SFT
Iterative SFT
XPO
模型类
Best of N 采样
Judges
回调
Data Utilities
文本环境
脚本工具
其他
加入 Hugging Face 社区
并获取增强的文档体验
在模型、数据集和 Spaces 上协作
通过加速推理获得更快的示例
切换文档主题
注册
开始
Liger Kernel 集成
本节正在建设中。欢迎贡献!
<
>
Update
on GitHub
←
DeepSpeed
PEFT
→
Liger
Kernel
集成