ポッドキャストを文字起こしするには？

ポッドキャストの RSS フィード URL を貼ってエピソードを選ぶか、音声ファイルの直リンク（.mp3・.m4a など）を貼ります。ツールは CORS を回避するためにプロキシ経由で音声を取得し、端末内の Whisper AI モデルでブラウザ内文字起こしします。プレーンテキスト・タイムスタンプ・字幕（SRT/VTT）が手に入ります。

RSS フィード URL はどこで見つかりますか？

多くのポッドキャスト配信サービスは番組ページに RSS フィードのリンクを掲載しており、各ディレクトリからも取得できます。そのフィード URL を貼ると、音声ファイル付きのエピソードが一覧表示されます。エピソードの MP3 直リンクがあれば、それを貼ってエピソード選択を飛ばすこともできます。

音声はサーバーにアップロードされますか？

文字起こし自体はすべてブラウザ内で実行され、音声がサーバーに保存されることはありません。サーバーが関わるのは、エピソード音声をブラウザへ中継する薄いプロキシだけです。これはポッドキャストの配信 CDN がブラウザからの直接ダウンロード（クロスオリジン）を許可しないために必要なもので、何も永続保存しません。

Spotify や Apple Podcasts のリンクは使えますか？

直接は使えません。Spotify はダウンロード可能な音声ファイルを公開していないため、Spotify のリンクは文字起こしできません。Apple Podcasts のページリンクも RSS フィードではありません。番組の RSS フィード URL、または音声ファイルの直リンクをお使いください。ほとんどの公開ポッドキャストで利用できます。

1本まるごとだとどのくらい時間がかかりますか？

長いエピソードは約2分ごとのパートに分けて処理され、進行に合わせて文字起こしが流れます。合計時間はエピソードの長さ・モデル・端末性能によります。WebGPU 対応ブラウザ（最近の Chrome・Edge）は CPU フォールバックよりはるかに高速です。非常に長いエピソードはメモリ負荷が高いため、モバイルよりデスクトップブラウザを推奨します。

字幕（SRT / VTT）で出力できますか？

はい。文字起こし後に、プレーンテキスト・タイムスタンプ付き・SRT・WebVTT を切り替えて、いずれもコピーやダウンロードができます。SRT と VTT はそのまま動画編集ソフトやプレーヤーの字幕トラックとして読み込めます。

無料ですか？結果を商用利用できますか？

はい。本ツールは無料で、文字起こしはローカルで完結します。Whisper は OpenAI により MIT ライセンスで、Transformers.js は Apache-2.0 ライセンスで公開されており、いずれも商用利用が許可されています。利用する音声を文字起こしする権利があることをご確認ください。

ポッドキャストを文字起こしする君

Q: どのモデルを選べばいい？

既定は「バランス（Whisper base・多言語）」で、日本語を含む多言語に対応します。「高精度（Whisper large-v3-turbo）」は日本語を含め最も高品質ですが初回ダウンロードが大きいため、WebGPU 対応ブラウザでの利用がおすすめです。「高速（Whisper tiny.en）」は最小・最速ですが英語専用です。

ポッドキャストの RSS フィード URL （または音声ファイルの直リンク）を貼るだけで、エピソードの音声をブラウザに取り込み、端末内の Whisper AI モデルで文字起こしします。プレーンテキスト・タイムスタンプ・字幕（ SRT/VTT ）が、何もアップロードせずに手に入ります。

使い方の仕組み

URL を渡すと音声を取得し、 Whisper がブラウザ内で音声をテキストに変換します。

ポッドキャストの RSS フィード URL を貼ってエピソードを選ぶか、音声ファイルの直リンク（.mp3・.m4a・.aac・.wav など）を貼って文字起こしに直行します。
エピソード音声は同一オリジンのプロキシ経由でストリーム取得され（ポッドキャスト CDN の CORS 制限を回避するためだけに使用）、16kHz モノラルへデコードされます。
音声は約2分ごとのパートに分割され、パート単位で文字起こしされます。エピソード全体を待たずに、文字起こしが順次画面に流れます。
結果はプレーンテキスト・タイムスタンプ付き・ SRT ・ WebVTT としてコピーやダウンロードができます。

文字起こしモデルはすべて端末内で動作します。サーバーには何も保存されません。

手順

ポッドキャストの RSS フィード URL （多くの番組・ディレクトリがリンクを掲載）、またはエピソード音声ファイルの直リンクを用意します。
ツールに貼り付けて「読み込む」を押します。
文字起こししたいエピソードを選びます（音声の直リンクの場合は自動でスキップ）。
モデルを選び、多言語モデルの場合は話されている言語を選びます。
「文字起こしする」を押すと、テキストが順次流れます。
字幕が必要なら SRT または VTT タブに切り替えて、コピーまたはダウンロードします。

RSS フィード URL と音声直リンクの違い

入力	挙動	向いている場面
RSS フィード URL	音声付きの全エピソードを一覧表示し、そこから選ぶ	番組を見ながらエピソードを選びたいとき
音声の直リンク（`.mp3`・`.m4a` など）	一覧を飛ばしてそのファイルを即文字起こし	エピソードの音声リンクを既に持っているとき

Spotify と Apple Podcasts のページリンクは使えません。 Spotify はダウンロード可能な音声ファイルを公開しておらず、 Apple のページリンクは RSS フィードではありません。 RSS フィード URL か音声の直リンクをお使いください。

どのモデルを選べばいい？

モデル	言語	初回ダウンロード	向いている用途
バランス（ Whisper base ）	多言語・日本語対応	約200MB	ほとんどの番組向けの既定
高精度（ Whisper large-v3-turbo ）	多言語・日本語対応	約760MB	最高品質。 WebGPU 対応ブラウザ推奨
高速（ Whisper tiny.en ）	英語専用	約120MB	英語番組の下書きを素早く

モデルは初回だけダウンロードされ、以降はキャッシュされて再利用されます。

例

https://feeds.example.com/my-show.xml のような番組の RSS フィードを貼り、最新エピソードを選び、バランスモデルのまま言語を「自動判定」にして「文字起こしする」を押します。1時間のエピソードは約2分ごとの約30パートとして順次流れ、完了したら SRT タブに切り替えて、動画編集ソフトにそのまま読み込める字幕をダウンロードできます。

プライバシー

サーバーが関わるのは、エピソード音声をブラウザへ中継する薄いプロキシだけです。これはポッドキャスト CDN がブラウザからのクロスオリジンダウンロードをブロックするために必要なものです。音声は永続保存されず、文字起こしは完全に端末内で行われます。最近の Chrome ・ Edge （ WebGPU ）が最速で、非常に長いエピソードではデスクトップブラウザを推奨します。

ポッドキャストを文字起こしする君

ポッドキャストを文字起こしする君

使い方の仕組み

手順

RSS フィード URL と音声直リンクの違い

どのモデルを選べばいい？

例

プライバシー

よくある質問

お問い合わせはこちら

お世話になっております

こんなご相談にお答えしています

オンラインで相談する

ポッドキャストを文字起こしする君

ポッドキャストを文字起こしする君

使い方の仕組み

手順

RSS フィード URL と 音声直リンクの違い

どのモデルを選べばいい？

例

プライバシー

よくある質問

ポッドキャストを文字起こしするには？

RSS フィード URL はどこで見つかりますか？

音声はサーバーにアップロードされますか？

Spotify や Apple Podcasts のリンクは使えますか？

どのモデルを選べばいい？

1本まるごとだとどのくらい時間がかかりますか？

字幕（SRT / VTT）で出力できますか？

無料ですか？結果を商用利用できますか？

お問い合わせはこちら

お世話になっております

こんなご相談にお答えしています

オンラインで相談する

RSS フィード URL と音声直リンクの違い