ポッドキャストを文字起こしする君
ポッドキャストの RSS フィード URL (または音声ファイルの直リンク)を貼るだけで、エピソードの音声をブラウザに取り込み、端末内の Whisper AI モデルで文字起こしします。プレーンテキスト・タイムスタンプ・字幕( SRT/VTT )が、何もアップロードせずに手に入ります。
使い方の仕組み
URL を渡すと音声を取得し、 Whisper がブラウザ内で音声をテキストに変換します。
- ポッドキャストの RSS フィード URL を貼ってエピソードを選ぶか、音声ファイルの直リンク(
.mp3・.m4a・.aac・.wavなど)を貼って文字起こしに直行します。 - エピソード音声は同一オリジンのプロキシ経由でストリーム取得され(ポッドキャスト CDN の CORS 制限を回避するためだけに使用)、16kHz モノラルへデコードされます。
- 音声は約2分ごとのパートに分割され、パート単位で文字起こしされます。エピソード全体を待たずに、文字起こしが順次画面に流れます。
- 結果はプレーンテキスト・タイムスタンプ付き・ SRT ・ WebVTT としてコピーやダウンロードができます。
文字起こしモデルはすべて端末内で動作します。サーバーには何も保存されません。
手順
- ポッドキャストの RSS フィード URL (多くの番組・ディレクトリがリンクを掲載)、またはエピソード音声ファイルの直リンクを用意します。
- ツールに貼り付けて「読み込む」を押します。
- 文字起こししたいエピソードを選びます(音声の直リンクの場合は自動でスキップ)。
- モデルを選び、多言語モデルの場合は話されている言語を選びます。
- 「文字起こしする」を押すと、テキストが順次流れます。
- 字幕が必要なら SRT または VTT タブに切り替えて、コピーまたはダウンロードします。
RSS フィード URL と 音声直リンクの違い
| 入力 | 挙動 | 向いている場面 |
|---|---|---|
| RSS フィード URL | 音声付きの全エピソードを一覧表示し、そこから選ぶ | 番組を見ながらエピソードを選びたいとき |
音声の直リンク(.mp3・.m4a など) | 一覧を飛ばしてそのファイルを即文字起こし | エピソードの音声リンクを既に持っているとき |
Spotify と Apple Podcasts のページリンクは使えません。 Spotify はダウンロード可能な音声ファイルを公開しておらず、 Apple のページリンクは RSS フィードではありません。 RSS フィード URL か音声の直リンクをお使いください。
どのモデルを選べばいい?
| モデル | 言語 | 初回ダウンロード | 向いている用途 |
|---|---|---|---|
| バランス( Whisper base ) | 多言語・日本語対応 | 約200MB | ほとんどの番組向けの既定 |
| 高精度( Whisper large-v3-turbo ) | 多言語・日本語対応 | 約760MB | 最高品質。 WebGPU 対応ブラウザ推奨 |
| 高速( Whisper tiny.en ) | 英語専用 | 約120MB | 英語番組の下書きを素早く |
モデルは初回だけダウンロードされ、以降はキャッシュされて再利用されます。
例
https://feeds.example.com/my-show.xml のような番組の RSS フィードを貼り、最新エピソードを選び、バランスモデルのまま言語を「自動判定」にして「文字起こしする」を押します。1時間のエピソードは約2分ごとの約30パートとして順次流れ、完了したら SRT タブに切り替えて、動画編集ソフトにそのまま読み込める字幕をダウンロードできます。
プライバシー
サーバーが関わるのは、エピソード音声をブラウザへ中継する薄いプロキシだけです。これはポッドキャスト CDN がブラウザからのクロスオリジンダウンロードをブロックするために必要なものです。音声は永続保存されず、文字起こしは完全に端末内で行われます。最近の Chrome ・ Edge ( WebGPU )が最速で、非常に長いエピソードではデスクトップブラウザを推奨します。
