AI Voice Generation AI VOICE GENERATION

打字。聆聽。用你自己嘅聲音。

將任何文字變成自然嘅語音 — 仲可以由一段短片段複製出你自己嘅聲音 — 全部喺你部機上完成。配合裝置上嘅聲音,一切都喺你自己部機運行,所以你嘅文稿同你嘅聲音樣本根本唔使離開你部機。

喺 Microsoft Store 下載 睇睇佢有咩功能 ↓

免費起步 • 你嘅第一個聲音複製係免費嘅 • 裝置上嘅聲音可離線使用

AI VOICE GENERATION 嘅功能

一個以本地為先嘅文字轉語音同聲音複製工作室

貼上一句句子、一段文字,又或者一整份文稿,揀一把聲音,再撳生成即可聽到自然嘅語音。想要一把特定嘅聲音?錄製或拖入一段短嘅參考片段,應用程式就會建立一把可以重用嘅自訂複製聲音 — 預設全部都喺你自己部電腦上運行。

主要功能

製作令你引以為傲嘅語音所需嘅一切

一個真正嘅聲音庫、你自己嘅複製聲音、即時重播,仲有匯出 — 全部都喺你自己部機上完成。

一撳即將文字轉語音

打字或貼上文字 — 離線聲音冇長度限制 — 揀一個角色,再撳朗讀就聽到佢串流返畀你。停止隨時都會乾淨利落咁完成。

複製你自己嘅聲音

由一段短嘅參考片段製作一把自訂聲音 — 錄製 6–15 秒,又或者匯入一個檔案 — 毋須訓練步驟,亦毋須錄音室。你嘅複製聲音會顯示喺選擇器頂部以便即時重用,而你嘅第一個複製係免費嘅。

一個真正嘅聲音庫

由內建嘅離線聲音、優質雲端聲音、高質素嘅裝置上神經網絡聲音,以及你自己嘅複製聲音中揀選 — 全部都喺同一個可搜尋嘅選擇器入面。

快速搵到任何聲音

喺清單上方嘅快速篩選框入面打字,即可按名稱或語言即時收窄。你嘅複製聲音會一直歸組喺頂部,所以永遠都係一撳就到。

毋須重新合成即可重播

一個附波形拖曳條嘅可拖曳片段播放器,可即時重播你最後生成嘅片段同你嘅複製參考片段 — 毋須重新生成。可將朗讀速度由 0.5× 調至 2.0× 而唔改變音高,然後匯出為 WAV 或 MP3。

預設離線,刻意私密

內建嘅 Amy 聲音完全喺你部機上運行 — 關咗網絡佢都繼續用得。複製參考音訊同你嘅生成記錄會加密儲存喺裝置上。只有可選嘅雲端聲音先會將你嘅文字送離裝置,而且淨係喺你揀選佢哋嗰陣。

支援 16 種語言

介面提供 16 種語言,並自動跟隨你嘅作業系統,亦可喺設定中一鍵切換。聲音本身亦講多種唔同語言。

揀選你嘅引擎

用裝置上嘅 Piper 聲音免費起步。Pro 加入優質嘅 OpenAI 相容雲端聲音、高質素嘅裝置上神經網絡聲音(Kokoro、Parler-TTS),以及進階複製引擎(OpenVoice、Zonos、MetaVoice)— 為每項工作揀啱嘅工具。

為流暢而設

即時狀態列會喺音訊生成時報告進度,完整嘅鍵盤無障礙操作令你保持快捷,仲有一個無介面嘅命令列工具可以編寫腳本批次生成。喺多次生成之間保持裝置上嘅 AI 聲音載入,令重複生成即時開始。

運作方式

三步將文字變成口語音訊

1. 打你嘅文字

打字或貼上你想朗讀嘅內容。免費嘅裝置上聲音只需首次使用時下載一次(約 60 MB),之後就離線運行 — 唔會傳送到任何地方。

2. 揀一把聲音再朗讀

揀選離線嘅 Amy 聲音、你自己嘅複製聲音,又或者一把 Pro 聲音庫嘅聲音,設定速度,再撳朗讀。音訊就會串流入嚟並播放。

3. 重播同儲存

用可拖曳播放器拖曳同重播片段 — 毋須重新生成 — 然後儲存為 WAV 或 MP3 檔案,用於旁白、播客或無障礙音訊。

FREE 對 PRO

一把免費聲音同一個免費複製 — 唔止係試用

免費層級畀你一把真正嘅聲音同一把真正嘅複製聲音。Pro 在於選擇 — 完整嘅聲音庫、雲端同裝置上神經網絡聲音,以及無限複製。

Free

  • 離線嘅 Amy 聲音(Piper)— 完全喺你部機上,毋須帳戶,冇限制
  • 你嘅第一把複製聲音,用免費複製引擎製作 — 顯示喺選擇器頂部,冇 Pro 標記
  • 完整嘅應用程式 — 朗讀、停止、速度、可拖曳播放器、匯出、快速篩選同 CLI
  • 冇逐字計數器,亦冇使用上限

Pro

  • 所有其他 Piper 聲音(更多角色同語言)
  • 雲端聲音 — 用你自己嘅 API 金鑰嘅優質 OpenAI 相容聲音
  • 本地 AI 聲音(Kokoro、Parler-TTS)— 高質素,喺你部機上,冇任何嘢送出去
  • 無限複製同進階複製引擎(OpenVoice、Zonos、MetaVoice)

Pro 分個人版同商業版條款;兩者解鎖相同嘅聲音 — 分別在於授權條款,而唔係功能。學生、教育工作者、研究人員、非牟利機構同其他合資格用戶,可申請一個為期 12 個月嘅免費 Pro 授權。

一切預設離線運行。只有可選嘅雲端聲音同可選嘅 AI-Server 複製卸載先會將資料送離你部機,而且淨係喺你揀選佢哋嗰陣。裝置上神經網絡聲音同大型複製模型首次使用時會下載大檔案(最重嗰啲可能要 30–60 分鐘);離線嘅 Amy 聲音淨係下載約 60 MB。

適合對象

為每一個重視文字 — 同聲音 — 私隱嘅人而設

當文稿屬敏感內容,又或者把聲音係你要自己保留嘅,AI Voice Generation 將 AI 帶到你嘅文字身邊,而唔係將你嘅文字同聲音樣本送上雲端。

內容創作者

需要旁白同朗讀嘅 YouTuber、播客主持同影片剪輯師 — 仲有一把可以喺各集之間重用、毋須重新錄製嘅一致自訂聲音。

無障礙

任何想將文字用清晰、一致、離線都用得嘅裝置上聲音朗讀出嚟嘅人 — 毋須帳戶,冇使用費。

教育工作者 & 電子學習

將課堂文稿、簡報同講義變成有旁白音訊嘅老師同課程作者,全程私密、毋須帳戶。

開發者 & 重視私隱嘅團隊

一個無介面嘅命令列工具可以編寫腳本批次生成語音,而對於唔可以將文稿或聲音肖像送畀第三方雲端嘅機構,就有加密嘅裝置上儲存同離線預設。

實際效果

AI Voice Generation 內部一覽

AI Voice Generation 頁面,已輸入文字,並有聲音選擇器、速度控制以及朗讀、停止同儲存按鈕

聲音頁面:打你嘅文字、揀一把聲音同速度,再撳朗讀 — 音訊生成時會有即時狀態列。

聲音選擇器已開啟,複製聲音歸組喺頂部,並有一個快速篩選搜尋框收窄清單

一個可搜尋嘅聲音庫 — 快速篩選搵到任何聲音,你嘅複製聲音會固定喺頂部。

可拖曳片段播放器,附波形同拖曳條,正重播一段生成嘅片段

用可拖曳波形播放器即時重播任何片段 — 毋須重新合成。

聲音複製頁面,正由一段參考片段建立一把自訂複製聲音

由一段短嘅參考片段建立一把自訂複製聲音 — 你嘅第一個複製係免費嘅。

正揀選一個複製引擎,列出免費引擎同進階 Pro 引擎

揀選一個複製引擎 — 用免費引擎起步,又或者用 Pro 嘅進階引擎獲得更高質素。

正由咪錄製一段參考片段嚟複製你自己嘅聲音

由你嘅咪錄製 6–15 秒 — 又或者匯入一段片段 — 嚟複製你自己嘅聲音。

正擷取電腦自己嘅音訊作為複製嘅參考來源

用你嘅咪或者電腦自己嘅音訊作為複製嘅參考來源。

預設聲音、輸出格式、朗讀速度、音訊保留同保持 AI 模型載入嘅設定

設定:預設聲音、輸出格式同速度、音訊保留,以及保持裝置上嘅 AI 聲音載入。

介面語言選擇器,顯示 16 種支援嘅語言

16 種語言嘅本地化介面,一鍵即可切換。

桌面、瀏覽器同流動裝置

桌面版(Windows、macOS、Linux)係主要版本,並附帶一個無介面嘅命令列工具供自動化之用。瀏覽器、iOS 同 Android 版本亦已推出 — 部分進階嘅裝置上神經網絡聲音同複製引擎需要一部夠強嘅桌面電腦(有幾個係 GPU 專用)。今日就喺 Windows 嘅 Microsoft Store 取得。

方案

Free 真係用得。Pro 在於聲音嘅選擇。

Free 畀你完整嘅應用程式 — 文字轉語音、你嘅第一個聲音複製、可拖曳播放器、匯出、快速篩選同 CLI — 配備離線嘅 Amy 聲音,冇使用計量器亦冇煩人畫面。Pro 解鎖完整嘅聲音庫:每一把內建聲音、優質雲端聲音、高質素嘅裝置上神經網絡聲音、進階複製引擎,以及無限複製。

學生、教育工作者、研究人員、非牟利機構同其他合資格用戶,可申請一個為期 12 個月嘅免費 Pro 授權。

私密咁畀你嘅文字一把聲音

免費起步,設計上以裝置為本,仲有免費嘅第一個聲音複製。喺 Microsoft Store 取得 AI Voice Generation,又或者先睇睇各個方案。

訂閱產品更新

全新免費 AI 產品、重大更新、以及僅在本網站發布的新版本。絕無垃圾訊息。