Hugging Face 和 Cloudflare 合作,通过 FastRTC 实现无缝实时语音和视频

发布于 2025 年 4 月 9 日
在 GitHub 上更新

我们很高兴地宣布 Cloudflare 和 Hugging Face 建立新的合作伙伴关系,通过 Hugging Face token 为 FastRTC 开发者提供企业级 WebRTC 基础设施的即时访问权限。

作为您可以使用 FastRTC 和 Cloudflare 构建的预览,请查看使用 Meta 新 Llama 4 模型构建的语音聊天 应用程序

弥补人工智能开发者工具箱中的空白

随着对话式人工智能成为工具、产品和服务的核心接口,实时通信基础设施对于支持自然、多模态的交互变得越来越重要。Hugging Face 构建了 FastRTC,通过抽象 WebRTC(实时通信的黄金标准技术)的复杂性,使人工智能开发者能够使用最少的 Python 代码构建低延迟、人工智能驱动的音频和视频流。

WebRTC 驱动的应用程序由于需要专门的 TURN 服务器而经常面临部署挑战,这些服务器能够实现跨不同网络环境的可靠连接。为了解决这个问题,Cloudflare 已经构建了一个遍布全球 335 多个地点的全球 TURN 服务器网络。

这种合作将 FastRTC 简单的开发方法与 Cloudflare 的全球 TURN 网络相结合,确保开发者能够构建具有全球连接性的快速可靠的 WebRTC 应用程序。

使用您的 Hugging Face 账户免费访问

拥有有效 Hugging Face 访问令牌的 FastRTC 开发者每月可以免费传输 10GB 数据,无需信用卡。一旦达到每月限额,开发者可以切换到他们的 Cloudflare 账户以获得更高的容量(说明)。

为什么这对人工智能开发者很重要

这种合作对于构建以下应用的人工智能开发者尤其有价值:

  • 需要可靠、低延迟音频流的语音助手
  • 实时处理摄像头输入的视频分析应用程序
  • 结合音频、视频和文本的多模态人工智能应用程序

这种合作使开发者能够专注于使用 FastRTC 的核心应用程序逻辑,同时无需构建和维护 TURN 基础设施。Cloudflare 的托管服务处理全球可扩展性和可靠性,使人工智能开发者能够提供卓越的体验,而无需维护基础设施的额外开销。

入门

此集成将在 FastRTC 版本 0.0.20 及更高版本中可用。要开始使用:

  • 确保您拥有具有读取权限的 Hugging Face 令牌(在此处获取 此处
  • 安装或升级 FastRTC:pip install --upgrade 'fastrtc[vad]'
  • 配置您的流以使用 Cloudflare TURN 网络,如下所示
from fastrtc import ReplyOnPause, Stream, get_cloudflare_turn_credentials
import os

os.environ["HF_TOKEN"] = "<your-hf-token>"

def echo(audio):
    yield audio

stream = Stream(ReplyOnPause(echo),
                rtc_config=get_cloudflare_turn_credentials)
stream.ui.launch()

使用 python 启动您的脚本,python <您的脚本名称>.py

有关更多示例,请参阅 Hugging Face 上的此 集合 以及 FastRTC 食谱

接下来

如果您有任何问题或反馈,请通过 GitHubHugging Face 与我们联系。请在 Hugging Face 上关注我们以获取最新更新和公告。

社区

注册登录 发表评论