AI DICTATION 能做什么

在您电脑上运行的私密转录工具

口述、捕捉系统音频，或转录文件 — 即可获得整洁、可编辑、带时间戳和字幕的文字，全部在您自己的设备上完成。

麦克风、系统音频或文件

通过麦克风实时口述、转录电脑自身的音频 — 一场会议或正在播放的视频 — 或将已有的录音转为文字。一键切换音源，实时电平表会显示您的输入已被接收。

默认离线，隐私为本

借助设备端 Whisper 引擎，您的音频完全在您的设备上转录 — 关闭网络它依然照常工作。转录文本和录音以加密形式存储，绝不上传。云端转录需您主动选用，并有清晰标注。

字幕与整洁导出

将转录文本保存为纯文本，或保存为 SubRip (.srt) 和 WebVTT (.vtt) 字幕以为视频配字幕 — 开启时间戳即可获得精准的字幕时轴 — 或保存为 JSON，包含每个片段的时间信息，供您自己的工具使用。

回放与重新转录

每段录音都会被保存，您可以用波形拖动条回放它，并看着每个词随播放逐一高亮。随时用更精准的模型重新转录某段录音 — 结果会另存为新条目，绝不覆盖原文。

支持多种语言

可转录数十种口语语言 — 选定一种，或让它自动检测。界面本身提供 16 种语言，并会自动跟随您的操作系统，也可在设置中一键切换。

由您掌控的历史记录

每份转录文本都会以加密形式保存在本地，随时可重新打开、复制或继续。用查找功能搜索任意转录文本 — 它还会将您的近期列表筛选为提及所输入内容的录音 — 并可随时删除任意条目。

整洁的转录文本

语音模型还会标记非语音声响，如 [Music] 或 (laughs)。可选择如何处理它们 — 保留、去掉标记但保留文字，或整行删除音乐与噪声 — 而原始模型输出始终就在一个面板之外。

选择您的引擎

从一款功能强大的设备端 Whisper 模型免费起步 — 首次录音时它会自动选定并下载。Pro 解锁更大的模型、OpenAI 云端引擎，以及一款支持 GPU 的本地引擎，专为最棘手的音频而设。

为流畅而生

停止时会补完您最后的话语而非将其丢弃，一键复制或保存，并通过可重新映射的键盘快捷键操控一切。让模型保持加载，使重复转录即刻启动，长任务还有内置的 GPU 安全限制。

工作原理

三步即可将口语转为文字

1. 选择您的音源

选择麦克风、电脑音频或音频文件。免费的设备端引擎首次使用时下载一次，随后离线运行 — 不会向任何地方发送数据。

2. 录制或转录

点击录制并开始说话，或选择一个文件并按下转录。文字会随您逐段实时流入。

3. 按您的方式使用

复制转录文本，将其保存为文本或字幕，回放录音，或用更好的模型重新转录。每一次记录都会保存在您加密的本地历史中。

适合对象

适合任何重视其话语隐私的人

当录音内容敏感、或本就只属于您时，AI Dictation 把 AI 带到您的音频旁，而非将您的音频送上云端。

隐私与合规

访谈、会议、医疗记录和法律口述均留在设备上 — 契合医疗、法律、金融、政府及其他音频不能上云的场景。

无使用费

没有按分钟计费的云端转录费用。使用免费的设备端引擎随心转录，并可持续离线工作。

更快的笔记与字幕

将一场会议化为纪要、一段语音备忘化为文字，或一个视频化为字幕 — 只需几分钟，无需离开您的桌面。

您的数据，您的模型

选择运行哪款引擎，让音频留在您自己的机器上，并通过命令行或经 MCP 连接的智能体实现转录自动化 — 全程没有第三方介入。

套餐

每项功能皆免费。Pro 关乎引擎的选择。

免费版即为完整的应用 — 实时口述、系统音频与文件转录、字幕导出、回放、重新转录、加密历史、查找以及 CLI — 搭载一款功能强大的设备端 Whisper 模型，没有时间限制，也没有打扰式弹窗。Pro 只在您需要额外精度时，解锁更大的模型、OpenAI 云端引擎以及一款支持 GPU 的本地引擎；任何功能都绝不会被锁起来。

学生、教育工作者、研究人员、非营利组织及其他合资格用户可申请为期 12 个月的免费 Pro 许可。

查看套餐与许可 →

将您的语音私密地转为文字。