
Text-to-Speech
On-Device AI
离线 TTS 基准测试:在 Android/iOS 上评测 18 个模型
涵盖 Kokoro、Piper、Matcha、Kitten 和 VITS 在内的 Android/iOS 端侧 18 个 TTS 模型综合基准测试
Akinori Nakajima - VoicePing
3 min
VoicePing的见解、技巧和更新

涵盖 Kokoro、Piper、Matcha、Kitten 和 VITS 在内的 Android/iOS 端侧 18 个 TTS 模型综合基准测试

在 Android、iOS、macOS 和 Windows 上对 16 个端侧语音识别模型和 9 个推理引擎进行的综合基准测试

对比32款语音翻译软件,覆盖商务会议、旅行、活动和访客接待。整理语音输入语言、离线能力、视频会议集成和企业安全。

VoicePing 如何基于定制化 Whisper V2 模型,在单条 WebSocket 流中实现自动、低延迟的语言切换——双语模式的完整设计历程。

在 6 个真实场景中对 NeMo MSDD 和 Pyannote 3.1 进行技术对比评估的研究报告。

将 Python WebSocket 代理用 Go 重写,实现无锁连接池和事件驱动的协调机制的技术报告。