语音转文字，即时输入

AI 润色，键盘启动器 — 离线运行，隐私无忧。

⬇ 下载 ⬇ 下载 Lite 版 ★ GitHub

Lite 版 — 更小体积，Apple Speech + 远程 ASR，无需下载大型本地模型

功能特性

macOS 上最全面的语音输入工具

🔒

隐私至上

零遥测、零分析、零数据收集。搭配自部署 LLM（如 Ollama），所有数据 — 语音、文本、词库 — 完全留在本机，绝不外流。

🎧

多引擎语音识别

五大引擎 — Apple Speech（零配置）、FunASR（中文优化）、MLX-Whisper（99 种语言，Apple GPU 加速）、Sherpa-ONNX 及 Whisper API。录音时实时流式转写浮层。

✨

AI 增强

LLM 驱动的纠错、翻译和链式管道，支持任何 OpenAI 兼容 API。剪贴板增强（Ctrl+Cmd+V）可直接处理选中文本。支持扩展思维可视化。

📚

自进化纠错

个人词库从纠正历史中学习专业术语，会话历史实现话题连续性。越用越准确。

🔍

启动器与代码片段

Alfred 风格搜索面板 — 应用、文件、剪贴板历史、书签、计算器（含单位换算）及命令面板。代码片段输入时自动展开。

💻

脚本与自动化

Python 插件系统，支持 Leader 键、快捷键、事件监听、持久化存储和 Shell 命令，实现 macOS 自动化。

使用方式

三步操作，无需切换窗口

按住录音

按住 fn 开始说话，实时浮层同步显示识别结果。Cmd 重新开始，Space 取消，Z 浏览最近历史。

松开转写

松开按键 — WenZi 转写语音，可选 AI 增强处理。

自动输入

结果自动输入到当前应用，或在预览面板中编辑、切换模式（⌘1–⌘9）、对比后确认。

预览面板 — 查看、编辑、切换模式、对比模型，确认后再输出

WenZi preview面板：ASR 结果、AI 增强、模式切换和可编辑的最终结果

语音识别引擎

根据语言和硬件选择最佳引擎

引擎	语言	速度	准确度	流式转录	下载大小
Apple Speech ⚠	多语言	快	良好	支持	无需下载（系统内置）
FunASR 默认	中文	快	高	不支持	~945 MB
MLX-Whisper	99 种语言	中等	高	不支持	75 MB – 1.6 GB
Sherpa-ONNX	多语言	快	高	支持	因模型而异
Whisper API	多语言	取决于网络	高	不支持	无需下载（云端）

安装

下载、拖入、启动 — 几秒即可就绪

	Standard	Lite
本地识别	全部 5 种引擎	Apple Speech（系统内置）
远程识别	Whisper API	Whisper API
AI 增强	完整	完整
启动器	完整	完整
脚本系统	完整	完整
安装包大小	~945 MB	~64 MB
	⬇ 下载	⬇ 下载