-
Timed Text Speech
テレストリームクラウド - タイムド・テキスト・スピーチ
機械学習ベースの音声テキスト化技術により、精度の高いクローズドキャプションや字幕用データを瞬時に作成します。
Timed Text Speech を使うメリット
迅速
スピーチエンジンが処理を続ける間も、オンラインで結果を確認することができ、時間を節約できます。
簡単
メディアファイルをアップロードするだけで、音声の文字起こしが始まり、様々なフォーマットで時間に応じたテキストが返されます。コスト対効果
文字起こししたメディアの 1 分あたりの料金で、使った分だけ支払うことも可能です。多言語対応
英語(英・米)、フランス語、日本語、中国語、スペイン語(カスティーリャ語、中南米、北米)、アラビア語、ブラジルポルトガル語など、多くの言語をサポート正確性
カスタムボキャブラリー(名称、頭字語、地名、専門用語)を使って、文字起こしの精度を向上させます。連携ツール
CaptionMaker から直接文字起こしすることができます。こんな方々に最適です
短納期でテレビやインターネットの放映をしなければならない一刻を争うコンテンツや、キャプションを要する宣伝広告のような短編コンテンツのために、キャプションや字幕を作成する必要があるコンテンツ制作者の方。
コスト対効果と簡単な操作による自動文字起こし機能で、サービスのスピードを向上させる時間効率の良いソリューションを求めているキャプションサービス会社。
他にも、キャプションの内製化を検討している企業や政府機関、教育機関などの方々にとって最適な製品です。


動作の仕組み
Timed Text Speech は、最新の機械学習(ML)ベースの技術を使用して、ビデオから抽出された人の音声をタイムスタンプ付きのテキストへと正確に文字に起こします。
この文字列を編集できることはもちろん、様々なキャプションや字幕の規格に合ったフォーマットに変更することも可能です。
Telestream Cloud コンソールを活用:
文字起こしにかかる時間は?
プロキシが必要か、文字起こしにカスタムボキャブラリーが必要かどうかによって倍率が変わります。
タイプ | 倍率 | 例 |
標準的な文字起こし | ー | ー |
プロキシビデオを使った標準的な文字起こし | 1.4 倍 | 10 分の文字起こしに 14 分かかります |
カスタムボキャブラリでの文字起こし | 2 倍 | 10 分の文字起こしに 20 分かかります |
プロキシビデオを使ったカスタムボキャブラリでの文字起こし | 2.4 倍 | 10 分の文字起こしに 24 分かかります |
Vantage Gateway
Telestream Cloud Vantage Gateway は、VOD コンテンツをクラウドで処理するための世界標準です。トランスコードサービスの先駆者となって 10 年以上、10 億以上の動画を処理し、現在では世界有数のメディア & エンターテインメントブランドのミッションクリティカルな OTT および放送ワークフローを支えています。
Vantage Cloud
Telestream Cloud Vantage Cloud は、1 つの ワークフロー でオンプレミスとクラウドの メディア 処理を同時にできます。また、ワークフローは、「オンプレミス」と「クラウド」のどちらで処理するかを設定できので、ハイブリッド な ワークフロー を実現する最適な選択肢です。
Timed Text Speech
Telestream Cloud Timed Text Speechは、機械学習ベースの音声テキスト化技術により、精度の高いクローズドキャプションや字幕用データを瞬時に作成します。日本語を含む様々な言語に対応し、キャプションや字幕用のデータを作成の効率を格段に引き上げます。