Whisper 是一个由 OpenAI 创建的自动语音识别(ASR)和语音翻译的预训练模型。它经过 68 万小时的标记数据训练,并且可以推广到许多数据集和领域,无需微调。Hugging Face 网站提供了该模型的访问权限,以及社区文件和正在运行的应用程序。此外,在 Twitter 上,OpenAI 宣布 Whisper 现在可以比以前快 70 倍的转录音频。

数据统计

相关导航