WenZi

语音转文字,即时输入

AI 润色,键盘启动器 — 离线运行,隐私无忧。

Lite 版 — 更小体积,Apple Speech + 远程 ASR,无需下载大型本地模型

最新版本

功能特性

macOS 上最全面的语音输入工具

🔒

隐私至上

零遥测、零分析、零数据收集。搭配自部署 LLM(如 Ollama),所有数据 — 语音、文本、词库 — 完全留在本机,绝不外流。

🎧

多引擎语音识别

五大引擎 — Apple Speech(零配置)、FunASR(中文优化)、MLX-Whisper(99 种语言,Apple GPU 加速)、Sherpa-ONNX 及 Whisper API。录音时实时流式转写浮层。

AI 增强

LLM 驱动的纠错、翻译和链式管道,支持任何 OpenAI 兼容 API。剪贴板增强(Ctrl+Cmd+V)可直接处理选中文本。支持扩展思维可视化。

📚

自进化纠错

个人词库从纠正历史中学习专业术语,会话历史实现话题连续性。越用越准确。

🔍

启动器与代码片段

Alfred 风格搜索面板 — 应用、文件、剪贴板历史、书签、计算器(含单位换算)及命令面板。代码片段输入时自动展开。

💻

脚本与自动化

Python 插件系统,支持 Leader 键、快捷键、事件监听、持久化存储和 Shell 命令,实现 macOS 自动化。

使用方式

三步操作,无需切换窗口

1

按住录音

按住 fn 开始说话,实时浮层同步显示识别结果。Cmd 重新开始,Space 取消,Z 浏览最近历史。

2

松开转写

松开按键 — WenZi 转写语音,可选 AI 增强处理。

3

自动输入

结果自动输入到当前应用,或在预览面板中编辑、切换模式(⌘1⌘9)、对比后确认。

预览面板 — 查看、编辑、切换模式、对比模型,确认后再输出

WenZi preview面板:ASR 结果、AI 增强、模式切换和可编辑的最终结果

语音识别引擎

根据语言和硬件选择最佳引擎

引擎 语言 速度 准确度 流式转录 下载大小
Apple Speech 多语言 良好 支持 无需下载(系统内置)
FunASR 默认 中文 不支持 ~945 MB
MLX-Whisper 99 种语言 中等 不支持 75 MB – 1.6 GB
Sherpa-ONNX 多语言 支持 因模型而异
Whisper API 多语言 取决于网络 不支持 无需下载(云端)

安装

下载、拖入、启动 — 几秒即可就绪

Standard Lite
本地识别 全部 5 种引擎 Apple Speech(系统内置)
远程识别 Whisper API Whisper API
AI 增强 完整 完整
启动器 完整 完整
脚本系统 完整 完整
安装包大小 ~945 MB ~64 MB
⬇ 下载 ⬇ 下载

文档

深入了解 WenZi 的每个功能