Whisper-large-v3快速部署：使用traefik实现多模型服务（Whisper+Qwen）路由

张

张建站

2026/6/6 7:38:47

10分钟阅读

Whisper-large-v3快速部署使用traefik实现多模型服务WhisperQwen路由1. 项目概述今天我们要介绍一个基于OpenAI Whisper Large v3的多语言语音识别Web服务它支持99种语言的自动检测与转录。这个项目由113小贝二次开发构建特别适合需要处理多语言语音识别的场景。核心亮点支持99种语言自动检测提供转录和翻译双模式采用GPU加速推理可通过Web界面或API调用2. 环境准备2.1 硬件要求资源最低规格推荐规格GPUNVIDIA RTX 3060 (8GB)NVIDIA RTX 4090 D (23GB)内存8GB16GB存储5GB10GB系统Ubuntu 20.04Ubuntu 24.04 LTS2.2 软件依赖# 安装基础依赖 sudo apt-get update sudo apt-get install -y ffmpeg python3-pip # 安装Python依赖 pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 pip install gradio4.0.0 whisper-web3. 基础部署3.1 快速启动服务# 克隆项目 git clone https://github.com/by113/Whisper-large-v3.git cd Whisper-large-v3 # 启动服务 python3 app.py服务启动后可以通过浏览器访问http://localhost:7860使用Web界面。3.2 服务验证import whisper # 加载模型 model whisper.load_model(large-v3, devicecuda) # 测试转录 result model.transcribe(example/audio.wav, languagezh) print(result[text])4. 使用Traefik实现多模型路由4.1 Traefik安装与配置# 安装Traefik wget https://github.com/traefik/traefik/releases/download/v2.10.7/traefik_v2.10.7_linux_amd64.tar.gz tar -zxvf traefik_v2.10.7_linux_amd64.tar.gz sudo mv traefik /usr/local/bin/创建配置文件traefik.yml:entryPoints: web: address: :80 websecure: address: :443 providers: file: filename: /etc/traefik/rules.yml watch: true api: dashboard: true insecure: true4.2 路由规则配置创建路由规则文件/etc/traefik/rules.yml:http: routers: whisper: rule: Host(whisper.yourdomain.com) service: whisper entryPoints: - web qwen: rule: Host(qwen.yourdomain.com) service: qwen entryPoints: - web services: whisper: loadBalancer: servers: - url: http://localhost:7860 qwen: loadBalancer: servers: - url: http://localhost:80004.3 启动Traefik服务# 启动Traefik traefik --configFiletraefik.yml5. 多模型服务集成5.1 Whisper服务配置修改app.py确保服务监听正确端口app gr.Interface( fntranscribe_audio, inputsgr.Audio(sourceupload, typefilepath), outputstext, titleWhisper Large v3 语音识别 ) app.launch(server_name0.0.0.0, server_port7860)5.2 Qwen服务集成假设我们同时部署了Qwen大模型服务# 启动Qwen服务 python -m qwen.serve --server-port 80006. 核心功能验证6.1 Whisper功能测试通过浏览器访问http://whisper.yourdomain.com应该能看到音频文件上传区域支持WAV/MP3/M4A/FLAC/OGG麦克风实时录音按钮语言自动检测选项转录/翻译模式切换6.2 Qwen功能测试访问http://qwen.yourdomain.com应该能看到Qwen大模型的交互界面。7. 性能优化建议7.1 GPU资源管理# 监控GPU使用情况 watch -n 1 nvidia-smi # 限制显存使用在app.py中添加 import torch torch.cuda.set_per_process_memory_fraction(0.8)7.2 负载均衡配置对于高并发场景可以扩展多个实例services: whisper: loadBalancer: servers: - url: http://localhost:7860 - url: http://localhost:7861 - url: http://localhost:78628. 常见问题解决8.1 服务启动问题问题解决方案端口冲突修改app.py中的server_port或停止占用端口的进程CUDA内存不足使用medium或small模型版本FFmpeg缺失运行sudo apt-get install -y ffmpeg8.2 路由配置问题# 检查路由规则 curl -H Host: whisper.yourdomain.com http://localhost curl -H Host: qwen.yourdomain.com http://localhost # 查看Traefik日志 journalctl -u traefik -f9. 总结通过本文的部署指南我们成功实现了Whisper-large-v3语音识别服务的快速部署使用Traefik实现多模型服务的智能路由Whisper与Qwen大模型的协同工作环境搭建性能监控与优化方案这种架构特别适合需要同时运行多个AI服务的场景通过统一的入口管理不同模型既提高了资源利用率又简化了访问方式。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

【烘焙坊项目】后端搭建（4） - 公共字段自动填充

一、公共字段自动填充1.1问题分析序号字段名含义数据类型操作类型1create_time创建时间datetimeinsert2create_user创建人idbigintinsert3update_time修改时间datetimeinsert , update4update_user修改人idbigintinsert , update每次开发相关接口都需要写一遍这些字段信息&…...

2026/6/3 17:09:16 阅读更多 →

LeetCode每日算法2

11.括号生成数字 n 代表生成括号的对数，请你设计一个函数，用于能够生成所有可能的并且有效的括号组合。每个右括号都有一个对应的相同类型的左括号。 class Solution:def generateParenthesis(self, n: int) -> List[str]:res[]cur_strdef dfs(…...

2026/6/3 13:51:31 阅读更多 →

基础语法·上(golang笔记第一期)

p.s.这是萌新自己自学总结的笔记，如果想学习得更透彻的话还是请去看大佬的讲解目录hello golang变量与常量声明函数返回值import与init指针defer数组maphello golang package main // 声明 main 包import "fmt" // 导入 fmt 包，用于输入输…...

2026/6/3 13:30:56 阅读更多 →

量子误差缓解技术：原理、应用与优化

1. 量子误差缓解技术概述量子计算在NISQ（含噪中等规模量子）时代面临的核心挑战之一是量子噪声对计算结果的干扰。误差缓解技术作为当前最实用的解决方案，能够在硬件层面纠错技术成熟前，显著提升量子算法的执行精度。与传统纠错不同…...

2026/6/5 11:46:58 阅读更多 →

从新手到专家：Ryzen SDT调试工具完整指南，轻松解锁AMD处理器隐藏性能

从新手到专家：Ryzen SDT调试工具完整指南，轻松解锁AMD处理器隐藏性能【免费下载链接】SMUDebugTool A dedicated tool to help write/read various parameters of Ryzen-based systems, such as manual overclock, SMU, PCI, CPUID, MSR and Power Tabl…...

2026/6/5 8:19:29 阅读更多 →

如何用Poppins字体解决多语言设计难题：新手完整指南

如何用Poppins字体解决多语言设计难题：新手完整指南【免费下载链接】Poppins Poppins, a Devanagari Latin family for Google Fonts. 项目地址: https://gitcode.com/gh_mirrors/po/Poppins 你是否曾为多语言项目中的字体选择而烦恼？当你的网站…...

2026/6/5 11:12:04 阅读更多 →