プライバシー・セキュリティに関する質問

いいえ、送信されません。VTTはすべての処理をお使いのブラウザ内で完結させます。音声データや文字起こしの結果がインターネット上のサーバーに送信されることは一切ありません。機密性の高い音声コンテンツも安心してご利用いただけます。

初回利用時はAIモデルデータのダウンロードのためにインターネット接続が必要です。ダウンロードされたモデルデータはブラウザにキャッシュされるため、2回目以降はオフライン環境でも利用可能です(ただし、ブラウザのキャッシュが削除されていない場合に限ります)。

いいえ、アカウント登録は不要です。サイトにアクセスするだけでどなたでもすぐにご利用いただけます。

精度・品質に関する質問

精度はご利用のモデル、音声の品質、話者の明瞭さなどによって異なります。一般に、大きなモデル(small、turbo/q4)ほど精度が高くなります。クリアな音声であれば高い精度が期待できますが、ノイズの多い音声や複数人が同時に話している音声では精度が低下する場合があります。

日本語、英語、中国語、韓国語に対応しています。また「自動検出」を選択すると、AIが音声の言語を自動で判定します。

ツール画面上で直接編集する機能はありませんが、ダウンロードしたVTTファイルはテキストファイルですので、任意のテキストエディタで内容を編集できます。

トラブル・エラーに関する質問

お使いのブラウザが、選択したファイルの音声コーデックをサポートしていない可能性があります。別のブラウザ(Google Chromeを推奨)をお試しいただくか、ファイルをMP4やMP3などの汎用的な形式に変換してから再度お試しください。

インターネット接続が不安定な場合、モデルデータのダウンロードに失敗することがあります。接続を確認の上、ページを再読み込みしてから再度お試しください。また、ブラウザのストレージ容量が不足している場合も原因となりますので、キャッシュの整理をお試しください。

処理速度は端末のCPU/GPU性能、選択したモデルのサイズ、音声の長さに依存します。処理速度を改善するには、より軽量なモデル(tinyやbase)を選択する、音声ファイルを短く分割する、などの方法をお試しください。

非常に大きなファイルを処理する場合、ブラウザのメモリが不足してフリーズする可能性があります。ファイルサイズを小さくするか、他のタブやアプリケーションを閉じてメモリを確保してからお試しください。

動作環境に関する質問

対応ブラウザをお使いであれば、スマートフォンからもアクセス可能です。ただし、音声認識の推論処理は高い計算能力を必要とするため、スマートフォンでは処理に非常に長い時間がかかる場合があります。快適にご利用いただくには、デスクトップ環境を推奨します。

いいえ、Internet Explorerには対応しておりません。Google Chrome、Microsoft Edge、Mozilla Firefox、Safariの各最新版をご利用ください。

はい、ご利用いただけます。macOS上のSafari 16.4以降、Google Chrome 91以降、その他の対応ブラウザでご利用可能です。

VTTファイルに関する質問

VTT(WebVTT: Web Video Text Tracks)は、W3Cが策定したWeb標準の字幕フォーマットです。HTML5の <video> 要素や、YouTube、VLC Media Playerなど多くの動画プレーヤーで標準的にサポートされています。テキストファイルですので、テキストエディタで開いて内容を確認・編集することもできます。

ダウンロードしたVTTファイルは、動画プレーヤーの字幕機能で読み込むことで利用できます。HTML5のvideoタグに <track> 要素として追加する方法、VLC Media Playerの字幕メニューから読み込む方法、YouTubeの字幕管理画面からアップロードする方法などがあります。詳しくは使い方ガイドの「生成されたVTTファイルの使い方」をご参照ください。

VTTはWebVTT形式のみを出力します。SRT形式への変換機能はありませんが、VTTとSRTは構造が非常に似ているため、テキストエディタで比較的簡単に変換できます。また、オンラインの変換ツールを利用する方法もあります。