AI DICTATION
对着麦克风说话、捕捉电脑自身的音频,或转录一段录音 — 看着文字逐渐浮现。借助设备端模型,一切都在您自己的机器上运行,您的音频无需离开它。
前往 Microsoft Store 获取 看看它能做什么 ↓
免费上手 • 支持 Windows • 设备端引擎可离线工作
口述、捕捉系统音频,或转录文件 — 即可获得整洁、可编辑、带时间戳和字幕的文字,全部在您自己的设备上完成。
通过麦克风实时口述、转录电脑自身的音频 — 一场会议或正在播放的视频 — 或将已有的录音转为文字。一键切换音源,实时电平表会显示您的输入已被接收。
借助设备端 Whisper 引擎,您的音频完全在您的设备上转录 — 关闭网络它依然照常工作。转录文本和录音以加密形式存储,绝不上传。云端转录需您主动选用,并有清晰标注。
将转录文本保存为纯文本,或保存为 SubRip (.srt) 和 WebVTT (.vtt) 字幕以为视频配字幕 — 开启时间戳即可获得精准的字幕时轴 — 或保存为 JSON,包含每个片段的时间信息,供您自己的工具使用。
每段录音都会被保存,您可以用波形拖动条回放它,并看着每个词随播放逐一高亮。随时用更精准的模型重新转录某段录音 — 结果会另存为新条目,绝不覆盖原文。
可转录数十种口语语言 — 选定一种,或让它自动检测。界面本身提供 16 种语言,并会自动跟随您的操作系统,也可在设置中一键切换。
每份转录文本都会以加密形式保存在本地,随时可重新打开、复制或继续。用查找功能搜索任意转录文本 — 它还会将您的近期列表筛选为提及所输入内容的录音 — 并可随时删除任意条目。
语音模型还会标记非语音声响,如 [Music] 或 (laughs)。可选择如何处理它们 — 保留、去掉标记但保留文字,或整行删除音乐与噪声 — 而原始模型输出始终就在一个面板之外。
从一款功能强大的设备端 Whisper 模型免费起步 — 首次录音时它会自动选定并下载。Pro 解锁更大的模型、OpenAI 云端引擎,以及一款支持 GPU 的本地引擎,专为最棘手的音频而设。
停止时会补完您最后的话语而非将其丢弃,一键复制或保存,并通过可重新映射的键盘快捷键操控一切。让模型保持加载,使重复转录即刻启动,长任务还有内置的 GPU 安全限制。
选择麦克风、电脑音频或音频文件。免费的设备端引擎首次使用时下载一次,随后离线运行 — 不会向任何地方发送数据。
点击录制并开始说话,或选择一个文件并按下转录。文字会随您逐段实时流入。
复制转录文本,将其保存为文本或字幕,回放录音,或用更好的模型重新转录。每一次记录都会保存在您加密的本地历史中。
当录音内容敏感、或本就只属于您时,AI Dictation 把 AI 带到您的音频旁,而非将您的音频送上云端。
访谈、会议、医疗记录和法律口述均留在设备上 — 契合医疗、法律、金融、政府及其他音频不能上云的场景。
没有按分钟计费的云端转录费用。使用免费的设备端引擎随心转录,并可持续离线工作。
将一场会议化为纪要、一段语音备忘化为文字,或一个视频化为字幕 — 只需几分钟,无需离开您的桌面。
选择运行哪款引擎,让音频留在您自己的机器上,并通过命令行或经 MCP 连接的智能体实现转录自动化 — 全程没有第三方介入。
立即在 Windows 上通过 Microsoft Store 获取 AI Dictation,并附带可用于自动化的无界面 CLI 与 MCP 服务器。macOS、Linux、浏览器及移动版本已列入规划。
免费版即为完整的应用 — 实时口述、系统音频与文件转录、字幕导出、回放、重新转录、加密历史、查找以及 CLI — 搭载一款功能强大的设备端 Whisper 模型,没有时间限制,也没有打扰式弹窗。Pro 只在您需要额外精度时,解锁更大的模型、OpenAI 云端引擎以及一款支持 GPU 的本地引擎;任何功能都绝不会被锁起来。
学生、教育工作者、研究人员、非营利组织及其他合资格用户可申请为期 12 个月的免费 Pro 许可。
免费上手,设计上即在设备端运行。在 Windows 上通过 Microsoft Store 获取 AI Dictation,或先了解一下套餐。