スピークストリームラインの使い方【AI文字起こし・翻訳・要約・分析】

2023年11月7日2023年11月16日

スタティック

フォートトークの Ver.0.98.117にて、「スピークストリームライン」というAI機能が実装されました。

これはメディア（動画・音声）の文字起こし、翻訳、要約、および分析と提案を一度に行うことができる機能です。

また、その機能をYoutube動画に特化した「チューブスピークフロー」も同時に実装されました。

この記事ではその2つを紹介します。

スピークストリームラインとは

スピークストリームラインは、指定したメディア（動画・音声）を解析し、その文字起こし、翻訳、要約、および分析と提案を一度に行う機能です。

文字起こしの結果は、話者や発話ごとに表示されるため、複数話者の会話の際にも大きく役立ちます。

また、翻訳は解析する言語（翻訳元）が90言語、翻訳先が75言語に対応しています。

さらに、メディアの内容の要約と分析・提案も作成可能です。

スピークストリームラインの使い方

以下に「スピークストリームライン」を使い方を記します。

STEP

「AIコンテンツエンハンス – スタティック」をタップ

「追加機能」の「AIコンテンツエンハンス – スタティック」をタップします。

STEP

「スピークストリームライン」をタップ

「TransLingual Suit」の「スピークストリームライン」をタップします。

すると、スピークストリームラインの画面が表示されます。

STEP

メディア解析の設定

メディアの解析をする前に、まず設定を行います。

右上の「設定」メニュー（歯車ボタン）を表示し、以下の設定をします。

解析する主要言語選択: メディア内で主に話されている言語を指定します。
翻訳先の言語選択: 翻訳の結果に用いたい言語を指定します。
話者数選択: メディア内の、発話者の人数を指定します。

また、タイトルを付けたい場合は、タイトル入力欄にテキストを入力します。

ニャワ

設定の詳細は以下の項目をご覧くださいにゃ

メディア解析の設定

これらの設定は、メディアの読込み前に行う必要あります。

STEP

メディアファイルの選択

「選択・生成開始」ボタンをタップし、メディア（音声・動画）ファイルを選択します。

メディアとして読込み可能なファイル形式は以下です。

動画：mp4、mkv、flv、avi、wmv、mov、m4v、3gp
音声：mp3、wav、flac、m4a、aac、ogg、wma

STEP

セクションが作成される

メディアを選択すると、一覧にセクションが作成され、処理が始まります。

各セクションには以下の内容が表示されます。

タイトル: 読み込んだメディアのファイル名、またはタイトル入力欄に入れた内容が表示されます
再生時間: メディアの再生時間が表示されます。（ステータスが「完了」になった後に表示されます）
ステータス: 処理状況が「待機中」>「処理中」>「完了」の順に表示されます。
開始時間: セクションを作成した時間が表示されます。

作成したセクションはサーバに保存されるため、複数端末で利用可能です。また、他のAI機能と違い、ログアウトしても削除されません。

今のところ、一度作成したセクションは削除できません。

STEP

処理の完了

処理が終わるとステータスが「完了」に変わります。

データはサーバーに保存されるため、処理中に他の画面に移動したり、フォートトークを終了しても処理は継続されます。

STEP

結果画面の表示

解析完了後にセクションをタップすると、結果画面が表示されます。

結果画面の構成

結果画面は、再生プレイヤー（①）と、結果テキストビュー（②）の2つで構成されています。

再生プレイヤー: 読み込んだメディアが表示されます。
結果テキストビュー: 処理結果のテキストが表示されます。

結果テキストビューには、以下の4つのタブがあります。

話者解析テキスト
翻訳テキスト
要約テキスト
総合的な分析と提案

「話者解析テキスト」

文字起こしの内容が、話者ごと、発話ごとに区切られて表示されます。

各発話には、以下の内容が表示されます。

時間: 動画のどの区間に当たるが「s（数）」で表示されます。
話者: 話者ナンバーが表示されます。（同じナンバーは同じ話者を表します）
テキスト: 発話内容のテキストが表示されます。

また、各発話をタップすると、該当箇所が再生プレイヤーで再生されます。

「翻訳テキスト」

話者解析テキストが、「翻訳先の言語選択」で指定した言語で表示されます。

「要約テキスト」

メディア全体の要約文が表示されます。

表示をするには「要約はこちらをタップ」を押します。

「総合的な分析と提案」

メディアの内容をAIが解析し、総合的な分析と提案が表示されます。

表示をするには「総合的な分析と提案はこちらをタップ」を押します。

結果内容のエクスポート

結果内容をエクスポート（保存）するには、右上の共有ボタンをタップし、エクスポートしたいものを選択します。

話者解析HTML

「話者解析テキスト」を html 形式で保存します。

翻訳HTML

「翻訳テキスト」を html 形式で保存します。

要約テキスト

「要約テキスト」をテキスト形式で保存します。

総合的な分析と提案

「総合的な分析と提案」をテキスト形式で保存します。

メディア

解析に使ったメディア（動画・音声）をMP4形式で保存します。

トランスコードし直されるため、読み込んだメディアとは別のものになります。

チューブスピークフローの使い方

「スピークストリームライン」の機能をYoutube動画に特化したのが、チューブスピークフローです。

使い方はスピークストリームラインとほぼ同じあるため、異なる点のみを以下に記します。

スピークストリームラインとの違い

起動方法

起動は「AIコンテンツエンハンス – スタティック」の「チューブスピークフロー」から行います。

規約への同意

初回時に「利用規約」が表示されるので、内容確認後に「同意する」をタップします。

すると、チューブスピークフローシステムの画面が表示されます。

規約に同意すると、AIスタティックの項目に、チューブスピークフローの「詳細」が表示されるようになります。

YoutubeのURLを入力

メディアの解析をするには、入力欄にYoutubeのURLを入れます。

利用制限などについて

スピークストリームラインとチューブスピークフローには、以下のような利用制限などがあります。

利用可能回数

スピークストリームラインとチューブスピークフローは、両方合わせて1日3回まで利用可能です。

利用回数が3回を超ると、以下のようなメッセージが表示されます。

画像に alt 属性が指定されていません。ファイル名: ssl_over3times_request_failure_1_1-1024x233.webp

利用可能なメディアの容量

利用可能なメディアは、再生時間が30分以下かつ100MB以下の、動画または音声ファイルです。

その上限を超えたファイルを読み込むと、ステータスに「失敗」と表示されます。（その場合も1回利用とカウントされます）

また、チューブスピークフローでは、以下のようなメッセージが表示されます。

メディア解析の設定

メディア解析の設定には以下の2つがあります。

「設定」メニュー
タイトル設定

「設定」メニュー

一覧画面右上の「設定」メニューの項目は以下のようになっています。

解析する主要言語選択

メディアを解析する主要言語を100言語（自動認識を含む）から選択できます。

「自動認識」でもよいですが、言語を指定するとより精度が高まります。

「解析する主要言語」の内訳

自動認識
日本語
英語
中国語
ドイツ語
スペイン語
ロシア語
韓国語
フランス語
ポルトガル語
トルコ語
ポーランド語
カタロニア語
オランダ語
アラビア語
スウェーデン語
イタリア語
インドネシア語
ヒンディー語
フィンランド語
ベトナム語
ヘブライ語
ウクライナ語
ギリシャ語
マレー語
チェコ語
ルーマニア語
デンマーク語
ハンガリー語
タミル語
ノルウェー語
タイ語
ウルドゥ語
クロアチア語
ブルガリア語
リトアニア語
ラテン語
マオリ語
マラヤーラム語
ウェールズ語
スロバキア語
テルグ語
ペルシャ語
ラトビア語
ベンガル語
セルビア語
アゼルバイジャン語
スロベニア語
カンナダ語
エストニア語
マケドニア語
ブルトン語
バスク語
アイスランド語
アルメニア語
ネパール語
モンゴル語
ボスニア語
カザフ語
アルバニア語
スワヒリ語
ガリシア語
マラーティー語
パンジャブ語
シンハラ語
クメール語
ショナ語
ヨルバ語
ソマリ語
アフリカーンス語
オクシタン語
ジョージア語
ベラルーシ語
タジク語
シンディ語
グジャラート語
アムハラ語
イディッシュ語
ラオ語
ウズベク語
フェロー語
ハイチ語
パシュト語
トルクメン語
ニーノシュク語
マルタ語
サンスクリット語
ルクセンブルク語
ミャンマー語
チベット語
タガログ語
マダガスカル語
アッサム語
タタール語
ハワイ語
リンガラ語
ハウサ語
バシキール語
ジャワ語
スンダ語

翻訳先の言語選択

翻訳先の言語を全75言語から選択できます。

「翻訳先の言語」の内訳

日本語
アフリカーンス語
アルバニア語
アムハラ語
アラビア語
アルメニア語
アゼルバイジャン語
ベンガル語
ボスニア語
ブルガリア語
カタロニア語
中国語（簡体字）
中国語（繁体字）
クロアチア語
チェコ語
デンマーク語
ダリ語
オランダ語
英語
エストニア語
ペルシャ語
フィリピノ、タガログ語
フィンランド語
フランス語
フランス語（カナダ）
ジョージア語
ドイツ語
ギリシャ語
グジャラート語
ハイチ語
ハウサ語
ヘブライ語
ヒンディー語
ハンガリー語
アイスランド語
インドネシア語
アイルランド語
イタリア語
カンナダ語
カザフ語
韓国語
ラトビア語
リトアニア語
マケドニア語
マレー語
マラヤーラム語
マルタ語
マラーティー語
モンゴル語
ノルウェー語（ブークモール）
パシュトー語
ポーランド語
ポルトガル語（ブラジル）
ポルトガル語（ポルトガル）
パンジャーブ語
ルーマニア語
ロシア語
セルビア語
シンハラ語
スロバキア語
スロベニア語
ソマリ語
スペイン語
スペイン語（メキシコ）
スワヒリ語
スウェーデン語
タミル語
テルグ語
タイ語
トルコ語
ウクライナ語
ウルドゥ語
ウズベク語
ベトナム語
ウェルシュ語

話者数選択

メディア内の話者人数（1〜99人）を指定します。

「自動認識」でもよいですが、人数を指定するとより精度が高まります。

タイトル設定

タイトルを設定したい場合は、「オプションでタイトルを入力」にテキストを入れておきます。

タイトル設定は、スピークストリームラインのみで行えます。

まとめ

スピークストリームラインは、メディア（動画・音声）ファイルを解析し、その文字起こし、翻訳、要約、および分析と提案を一度に行う機能です。

また、この機能をYoutube動画に特化したものがチューブスピークフローです。

利用可能回数は、スピークストリームラインとチューブスピークフローを合わせ、1日3回までです。

利用可能なメディアは、再生時間が30分以下、かつ100MB以下の動画・音声ファイルです。

URLをコピーしました！