AI Voice Generation AI VOICE GENERATION

入力する。聞く。あなただけの声で。

どんなテキストも自然な音声に変え — 短いクリップからあなた自身の声をクローンし — それをご自身のデバイス上で実現。オンデバイス音声なら、すべてがご自身のマシン上で動くので、台本も声のサンプルもデバイスの外に出る必要はありません。

Microsoft Store で入手 何ができるか見る ↓

無料で始められる • 最初の音声クローンは無料 • オンデバイス音声はオフラインで動作

AI VOICE GENERATION でできること

ローカルファーストのテキスト読み上げ&音声クローンスタジオ

一文でも、一段落でも、台本全体でも貼り付けて、声を選び、生成を押すだけで自然な音声が聞こえます。特定の声が欲しいですか?短い参照クリップを録音するかドロップすれば、アプリが再利用できるカスタムのクローン音声を作ります — 標準ではすべてご自身のコンピューター上で動作します。

主な機能

誇れる音声を作るために必要なすべて

本格的な音声ライブラリ、あなた自身のクローン音声、即時の再生、そしてエクスポート — すべてご自身のデバイス上で。

ワンクリックでテキスト読み上げ

テキストを入力または貼り付け — オフライン音声には長さの制限がありません — キャラクターを選んで Speak を押せば、ストリーミングで読み上げられます。Stop はいつでもきれいに最後まで仕上げてから止めます。

あなた自身の声をクローン

短い参照クリップからカスタム音声を作成 — 6–15 秒を録音するか、ファイルをインポート — トレーニング工程もスタジオも不要。クローンはピッカーの先頭に表示されてすぐ再利用でき、最初のクローンは無料です。

本格的な音声ライブラリ

内蔵のオフライン音声、プレミアムなクラウド音声、高品質なオンデバイスのニューラル音声、そしてあなた自身のクローン — これらすべてを、検索可能な 1 つのピッカーから選べます。

どんな声もすばやく見つかる

リスト上部のクイックフィルター欄に入力すれば、名前や言語で即座に絞り込めます。クローンした音声は常に先頭にまとめられるので、いつでもワンクリックで使えます。

再合成せずに再生

波形スクラバー付きのシーク可能なクリッププレーヤーが、直近に生成したクリップやクローン参照クリップを即座に再生します — 再生成は不要。ピッチを変えずに話速を 0.5× から 2.0× まで調整し、WAV または MP3 として書き出せます。

標準でオフライン、意図してプライベート

内蔵の Amy 音声はご自身のデバイス上で完全に動作します — ネットワークをオフにしても動き続けます。クローン参照音声と生成履歴はデバイス上に暗号化して保存されます。オプションのクラウド音声だけがテキストをデバイス外へ送り、しかもあなたが選んだときだけです。

16 言語で

インターフェースは 16 言語で利用でき、お使いのオペレーティングシステムに自動で従い、設定でワンクリック切り替えもできます。音声も幅広い言語を話します。

エンジンを選ぶ

オンデバイスの Piper 音声で無料スタート。Pro ではプレミアムな OpenAI 互換のクラウド音声、高品質なオンデバイスのニューラル音声(Kokoro、Parler-TTS)、そして高度なクローニングエンジン(OpenVoice、Zonos、MetaVoice)が加わります — 各作業に最適なツールをお選びください。

流れるような操作のために

ライブのステータス行が音声生成の進捗を伝え、フルキーボードアクセシビリティで素早く操作でき、ヘッドレスのコマンドラインツールが一括生成をスクリプト化します。オンデバイス AI 音声を生成と生成の間も読み込んだままにすれば、繰り返しが即座に始まります。

使い方

3 ステップでテキストから音声へ

1. テキストを入力

読み上げたい内容を入力または貼り付けます。無料のオンデバイス音声は初回利用時に一度だけダウンロードされ(約 60 MB)、その後はオフラインで動作します — どこにも何も送信されません。

2. 声を選んで話させる

オフラインの Amy 音声、あなた自身のクローン音声、または Pro ライブラリの音声を選び、速度を設定して Speak を押します。音声がストリーミングで流れ込み、再生されます。

3. 再生して保存

シーク可能なプレーヤーでクリップをスクラブして再生 — 再生成は不要 — し、ナレーション、ポッドキャスト、アクセシビリティ音声向けに WAV または MP3 ファイルとして保存します。

FREE と PRO

無料の音声と無料のクローン — 単なる試用ではありません

無料ティアでは本物の音声と本物のクローン音声が手に入ります。Pro は選択肢のためのもの — 完全なライブラリ、クラウドとオンデバイスのニューラル音声、そして無制限のクローン。

Free

  • オフラインの Amy 音声(Piper) — ご自身のデバイス上で完全に動作、アカウント不要、制限なし
  • 無料のクローニングエンジンで作る 最初のクローン音声 — Pro バッジなしでピッカーの先頭に表示
  • 完全なアプリ — 話す、停止、速度、シーク可能なプレーヤー、エクスポート、クイックフィルター、そして CLI
  • 文字数メーターなし、利用上限なし

Pro

  • 他のすべての Piper 音声(より多くのキャラクターと言語)
  • クラウド 音声 — ご自身の API キーを使うプレミアムな OpenAI 互換の音声
  • ローカル AI 音声(Kokoro、Parler-TTS) — 高品質で、ご自身のデバイス上で動作し、どこにも何も送信しません
  • 無制限のクローン と高度なクローニングエンジン(OpenVoice、Zonos、MetaVoice)

Pro には個人向けと商用向けの条件があり、どちらも同じ音声を解放します — 違いは機能ではなくライセンス条件です。学生、教育者、研究者、非営利団体、その他の条件を満たす方は、12 か月間無料の Pro ライセンスを申請できます。

すべて標準ではオフラインで動作します。オプションのクラウド音声と、オプションの AI-Server クローンオフロードだけがデバイス外へデータを送り、しかもあなたが選んだときだけです。オンデバイスのニューラル音声と大きなクローニングモデルは初回利用時に大きなファイルをダウンロードします(最も重いものは 30–60 分かかることがあります)。オフラインの Amy 音声はわずか約 60 MB のダウンロードです。

対象ユーザー

言葉 — そして声 — をプライベートに保つ価値のあるすべての人へ

台本が機密であるとき、あるいは声があなた自身のものであるとき、AI Voice Generation はテキストや声のサンプルをクラウドへ送る代わりに、AI をあなたのテキストのもとへ届けます。

コンテンツクリエイター

ナレーションやボイスオーバーを必要とする YouTuber、ポッドキャスター、動画編集者 — そしてエピソードをまたいで録り直しなしで再利用できる、一貫したカスタム音声を求める方へ。

アクセシビリティ

クリアで一貫したオンデバイスの声でテキストを読み上げてほしいすべての方へ — オフラインで動作し、アカウントも利用料金も不要です。

教育者 & e ラーニング

レッスン台本、スライド、配布資料を、プライベートでアカウント不要のワークフローでナレーション音声に変える教師やコース作成者に。

開発者 & プライバシー重視のチーム

ヘッドレスのコマンドラインツールが一括音声生成をスクリプト化。台本や声の似姿を第三者クラウドに送れない組織には、デバイス上での暗号化保存とオフライン標準動作が提供されます。

実際の動作

AI Voice Generation の内側を見る

テキストを入力した AI Voice Generation ページ。音声ピッカー、速度コントロール、Speak・Stop・Save ボタンを備える

Voice ページ:テキストを入力し、声と速度を選び、Speak を押すだけ — 音声生成中はライブのステータス行が表示されます。

クローン音声が上部にまとめられ、リストを絞り込むクイックフィルター検索欄を備えた、開いた音声ピッカー

検索可能な音声ライブラリ — クイックフィルターでどんな声も見つかり、クローンは先頭に固定されます。

波形とスクラバーで生成済みクリップを再生する、シーク可能なクリッププレーヤー

シーク可能な波形プレーヤーで、どんなクリップも即座に再生 — 再合成は不要です。

参照クリップからカスタムのクローン音声を作成する Voice Clones ページ

短い参照クリップからカスタムのクローン音声を作成 — 最初のクローンは無料です。

無料エンジンと高度な Pro エンジンが並ぶ、クローニングエンジンの選択画面

クローニングエンジンを選ぶ — 手始めの無料エンジン、または高品質な Pro の高度なエンジン。

自分の声をクローンするためにマイクから参照クリップを録音する様子

マイクから 6–15 秒録音 — またはクリップをインポート — して自分の声をクローン。

クローンの参照ソースとしてコンピューター自身の音声を取り込む様子

クローンの参照として、マイクまたはコンピューター自身の音声を使えます。

デフォルト音声、出力形式、話速、音声保持、AI モデルの読み込み維持に関する設定

設定:デフォルト音声、出力形式と速度、音声の保持、オンデバイス AI 音声の読み込み維持。

対応する 16 言語を表示するインターフェース言語セレクター

ワンクリックで切り替えられる、16 言語のローカライズされたインターフェース。

デスクトップ、ブラウザ、モバイル

デスクトップ(Windows、macOS、Linux)が主要ビルドで、自動化のためのヘッドレスなコマンドラインツールを備えています。ブラウザ、iOS、Android 版も利用できます — 一部の高度なオンデバイスのニューラル音声やクローニングエンジンは高性能なデスクトップを必要とします(いくつかは GPU 専用です)。今すぐ Windows の Microsoft Store から入手できます。

プラン

Free は本当に使えます。Pro は声の選択肢のためのものです。

Free では完全なアプリが手に入ります — テキスト読み上げ、最初の音声クローン、シーク可能なプレーヤー、エクスポート、クイックフィルター、そして CLI — オフラインの Amy 音声付きで、利用メーターもしつこい案内画面もありません。Pro では音声ライブラリ全体が解放されます:内蔵のすべての音声、プレミアムなクラウド音声、高品質なオンデバイスのニューラル音声、高度なクローニングエンジン、そして無制限のクローン。

学生、教育者、研究者、非営利団体、その他の条件を満たす方は、12 か月間無料の Pro ライセンスを申請できます。

あなたの言葉に、プライベートに声を

無料で始められ、設計段階からオンデバイス、最初の音声クローンは無料です。AI Voice Generation を Microsoft Store で入手するか、まずはプランをご覧ください。

製品アップデートを購読

新しい無料 AI 製品、重要なアップデート、本サイト限定の新リリース情報をお届けします。スパムは一切送りません。