アプリの音声をテキスト化できますか? - いまさら聞けないiPhoneのなぜ

音楽、動画、ゲームなど、iPhoneの至るところで「音声」が活用されています。その音声をテキスト化できれば、言葉を聞き逃すことが減るだけでなく理解も深まります。iOS 26では、かかってきた電話の声をリアルタイムにテキスト化する「ライブ留守番電話」が好評ですが、同じことを一般的なアプリでできれば便利ですよね。

そんなときは「ライブキャプション」を利用しましょう。「設定」→「アクセシビリティ」→「ライブキャプション」の順に画面を開き、「ライブキャプション」スイッチをオンにすれば準備完了です。この機能は指定した言語で聞き取ろうとするため、対象のアプリ/コンテンツが日本語の場合は画面下部の対応言語で「日本語(日本)」が選択されていることを確認しておきましょう。

ライブキャプションは、内蔵スピーカーやイヤホンを経由して出力される音声を対象に、リアルタイムで文字起こしを実行します。ライブキャプションを有効にすると現れる画面で「iPhoneオーディオ」を選択し、聞き取り対象にしたいアプリで音声を流せば、ただちに文字として表示されます。

しかも、対象とするアプリは限定されていません。電話アプリやFaceTimeといった音声の果たす役割が大きいアプリだけでなく、写真アプリに保存されているビデオ、YouTubeやNetflix、NHKプラスといった動画/ストリーミングアプリでも動作します。自分の言葉を対象にしたいときは、ライブキャプションの画面で「マイク」を選択すればOKです。

初期値設定では、聞き取る時間は1分とされているため、再生から1分を過ぎた言葉は消えてしまいますが、ライブキャプションの設定画面にある「通話のキャプションを保存」を「1時間」に変更しましょう。聞き逃しが格段に減るはずですよ。

海上忍 うなかみしのぶ IT/AVコラムニスト。UNIX系OSやスマートフォンに関する連載・著作多数。テクニカルな記事を手がける一方、エントリ層向けの柔らかいコラムも好み執筆する。マイナビニュースでは、「いまさら聞けないiPhoneのなぜ」のほか、前世紀から続く「(新)OS Xハッキング!」などを連載中。執筆以外では、オーディオ特化型Raspberry Pi向けLinuxディストリビューションの開発に情熱を注いでいる。2012年よりAV機器アワード「VGP」審査員。 この著者の記事一覧はこちら
元記事を読む