ダークモードに対応しました。(切替えは右下のスイッチで)

スピークストリームラインの使い方【AI文字起こし・翻訳・要約・分析】

スタティック

フォートトークの Ver.0.98.117にて、「スピークストリームライン」というAI機能が実装されました。

これはメディア(動画・音声)の文字起こし翻訳要約、および分析と提案を一度に行うことができる機能です。

また、その機能をYoutube動画に特化した「チューブスピークフロー」も同時に実装されました。

この記事ではその2つを紹介します。

目次

スピークストリームラインとは

スピークストリームラインは、指定したメディア(動画・音声)を解析し、その文字起こし翻訳要約、および分析と提案を一度に行う機能です。

文字起こしの結果は、話者や発話ごとに表示されるため、複数話者の会話の際にも大きく役立ちます。

話者や発話ごとに区切られて表示

また、翻訳は解析する言語(翻訳元)が90言語、翻訳先が75言語に対応しています。

さらに、メディアの内容の要約分析・提案も作成可能です。

スピークストリームラインの使い方

以下に「スピークストリームライン」を使い方を記します。

STEP
「AIコンテンツエンハンス – スタティック」をタップ

「追加機能」の「AIコンテンツエンハンス – スタティック」をタップします。

STEP
「スピークストリームライン」をタップ

「TransLingual Suit」の「スピークストリームライン」をタップします。

すると、スピークストリームラインの画面が表示されます。

STEP
メディア解析の設定

メディアの解析をする前に、まず設定を行います。

右上の「設定」メニュー(歯車ボタン)を表示し、以下の設定をします。

解析する主要言語選択

メディア内で主に話されている言語を指定します。

翻訳先の言語選択

翻訳の結果に用いたい言語を指定します。

話者数選択

メディア内の、発話者の人数を指定します。

また、タイトルを付けたい場合は、タイトル入力欄にテキストを入力します。

ニャワ

設定の詳細は以下の項目をご覧くださいにゃ

これらの設定は、メディアの読込み前に行う必要あります。

STEP
メディアファイルの選択

選択・生成開始」ボタンをタップし、メディア(音声・動画)ファイルを選択します。

メディアとして読込み可能なファイル形式は以下です。

動画:mp4、mkv、flv、avi、wmv、mov、m4v、3gp
音声:mp3、wav、flac、m4a、aac、ogg、wma

STEP
セクションが作成される

メディアを選択すると、一覧にセクションが作成され、処理が始まります。

各セクションには以下の内容が表示されます。

タイトル

読み込んだメディアのファイル名、またはタイトル入力欄に入れた内容が表示されます

再生時間

メディアの再生時間が表示されます。(ステータスが「完了」になった後に表示されます)

ステータス

処理状況が「待機中」>「処理中」>「完了」の順に表示されます。

開始時間

セクションを作成した時間が表示されます。

作成したセクションはサーバに保存されるため、複数端末で利用可能です。また、他のAI機能と違い、ログアウトしても削除されません

今のところ、一度作成したセクションは削除できません

STEP
処理の完了

処理が終わるとステータスが「完了」に変わります。

データはサーバーに保存されるため、処理中に他の画面に移動したり、フォートトークを終了しても処理は継続されます。

STEP
結果画面の表示

解析完了後にセクションをタップすると、結果画面が表示されます。

結果画面の構成

結果画面は、再生プレイヤー)と、結果テキストビュー)の2つで構成されています。

再生プレイヤー

読み込んだメディアが表示されます。

結果テキストビュー

処理結果のテキストが表示されます。

結果テキストビューには、以下の4つのタブがあります。

  • 話者解析テキスト
  • 翻訳テキスト
  • 要約テキスト
  • 総合的な分析と提案

「話者解析テキスト」

文字起こしの内容が、話者ごと発話ごとに区切られて表示されます。

各発話には、以下の内容が表示されます。

時間

動画のどの区間に当たるが「s(数)」で表示されます。

話者

話者ナンバーが表示されます。(同じナンバーは同じ話者を表します)

テキスト

発話内容のテキストが表示されます。

また、各発話をタップすると、該当箇所が再生プレイヤーで再生されます。

「翻訳テキスト」

話者解析テキストが、「翻訳先の言語選択」で指定した言語で表示されます。

「要約テキスト」

メディア全体の要約文が表示されます。

表示をするには「要約はこちらをタップ」を押します。

「総合的な分析と提案」

メディアの内容をAIが解析し、総合的な分析と提案が表示されます。

表示をするには「総合的な分析と提案はこちらをタップ」を押します。

結果内容のエクスポート

結果内容をエクスポート(保存)するには、右上の共有ボタンをタップし、エクスポートしたいものを選択します。

話者解析HTML

「話者解析テキスト」を html 形式で保存します。

翻訳HTML

「翻訳テキスト」を html 形式で保存します。

要約テキスト

「要約テキスト」をテキスト形式で保存します。

総合的な分析と提案

「総合的な分析と提案」をテキスト形式で保存します。

メディア

解析に使ったメディア(動画・音声)をMP4形式で保存します。

トランスコードし直されるため、読み込んだメディアとは別のものになります。

チューブスピークフローの使い方

「スピークストリームライン」の機能をYoutube動画に特化したのが、チューブスピークフローです。

使い方はスピークストリームラインとほぼ同じあるため、異なる点のみを以下に記します。

スピークストリームラインとの違い

起動方法

起動は「AIコンテンツエンハンス – スタティック」の「チューブスピークフロー」から行います。

規約への同意

初回時に「利用規約」が表示されるので、内容確認後に「同意する」をタップします。

すると、チューブスピークフローシステムの画面が表示されます。

規約に同意すると、AIスタティックの項目に、チューブスピークフローの「詳細」が表示されるようになります。

YoutubeのURLを入力

メディアの解析をするには、入力欄にYoutubeのURLを入れます。

利用制限などについて

スピークストリームラインとチューブスピークフローには、以下のような利用制限などがあります。

利用可能回数

スピークストリームラインとチューブスピークフローは、両方合わせて1日3回まで利用可能です。

利用回数が3回を超ると、以下のようなメッセージが表示されます。

画像に alt 属性が指定されていません。ファイル名: ssl_over3times_request_failure_1_1-1024x233.webp
利用可能なメディアの容量

利用可能なメディアは、再生時間が30分以下かつ100MB以下の、動画または音声ファイルです。

その上限を超えたファイルを読み込むと、ステータスに「失敗」と表示されます。(その場合も1回利用とカウントされます)

スピークストリームラインの場合

また、チューブスピークフローでは、以下のようなメッセージが表示されます。

チューブスピークフローの場合

メディア解析の設定

メディア解析の設定には以下の2つがあります。

「設定」メニュー

一覧画面右上の「設定」メニューの項目は以下のようになっています。

解析する主要言語選択

メディアを解析する主要言語100言語(自動認識を含む)から選択できます。

「自動認識」でもよいですが、言語を指定するとより精度が高まります。

「解析する主要言語」の内訳
  • 自動認識
  • 日本語
  • 英語
  • 中国語
  • ドイツ語
  • スペイン語
  • ロシア語
  • 韓国語
  • フランス語
  • ポルトガル語
  • トルコ語
  • ポーランド語
  • カタロニア語
  • オランダ語
  • アラビア語
  • スウェーデン語
  • イタリア語
  • インドネシア語
  • ヒンディー語
  • フィンランド語
  • ベトナム語
  • ヘブライ語
  • ウクライナ語
  • ギリシャ語
  • マレー語
  • チェコ語
  • ルーマニア語
  • デンマーク語
  • ハンガリー語
  • タミル語
  • ノルウェー語
  • タイ語
  • ウルドゥ語
  • クロアチア語
  • ブルガリア語
  • リトアニア語
  • ラテン語
  • マオリ語
  • マラヤーラム語
  • ウェールズ語
  • スロバキア語
  • テルグ語
  • ペルシャ語
  • ラトビア語
  • ベンガル語
  • セルビア語
  • アゼルバイジャン語
  • スロベニア語
  • カンナダ語
  • エストニア語
  • マケドニア語
  • ブルトン語
  • バスク語
  • アイスランド語
  • アルメニア語
  • ネパール語
  • モンゴル語
  • ボスニア語
  • カザフ語
  • アルバニア語
  • スワヒリ語
  • ガリシア語
  • マラーティー語
  • パンジャブ語
  • シンハラ語
  • クメール語
  • ショナ語
  • ヨルバ語
  • ソマリ語
  • アフリカーンス語
  • オクシタン語
  • ジョージア語
  • ベラルーシ語
  • タジク語
  • シンディ語
  • グジャラート語
  • アムハラ語
  • イディッシュ語
  • ラオ語
  • ウズベク語
  • フェロー語
  • ハイチ語
  • パシュト語
  • トルクメン語
  • ニーノシュク語
  • マルタ語
  • サンスクリット語
  • ルクセンブルク語
  • ミャンマー語
  • チベット語
  • タガログ語
  • マダガスカル語
  • アッサム語
  • タタール語
  • ハワイ語
  • リンガラ語
  • ハウサ語
  • バシキール語
  • ジャワ語
  • スンダ語
翻訳先の言語選択

翻訳先の言語を全75言語から選択できます。

「翻訳先の言語」の内訳
  • 日本語
  • アフリカーンス語
  • アルバニア語
  • アムハラ語
  • アラビア語
  • アルメニア語
  • アゼルバイジャン語
  • ベンガル語
  • ボスニア語
  • ブルガリア語
  • カタロニア語
  • 中国語(簡体字)
  • 中国語(繁体字)
  • クロアチア語
  • チェコ語
  • デンマーク語
  • ダリ語
  • オランダ語
  • 英語
  • エストニア語
  • ペルシャ語
  • フィリピノ、タガログ語
  • フィンランド語
  • フランス語
  • フランス語(カナダ)
  • ジョージア語
  • ドイツ語
  • ギリシャ語
  • グジャラート語
  • ハイチ語
  • ハウサ語
  • ヘブライ語
  • ヒンディー語
  • ハンガリー語
  • アイスランド語
  • インドネシア語
  • アイルランド語
  • イタリア語
  • カンナダ語
  • カザフ語
  • 韓国語
  • ラトビア語
  • リトアニア語
  • マケドニア語
  • マレー語
  • マラヤーラム語
  • マルタ語
  • マラーティー語
  • モンゴル語
  • ノルウェー語(ブークモール)
  • パシュトー語
  • ポーランド語
  • ポルトガル語(ブラジル)
  • ポルトガル語(ポルトガル)
  • パンジャーブ語
  • ルーマニア語
  • ロシア語
  • セルビア語
  • シンハラ語
  • スロバキア語
  • スロベニア語
  • ソマリ語
  • スペイン語
  • スペイン語(メキシコ)
  • スワヒリ語
  • スウェーデン語
  • タミル語
  • テルグ語
  • タイ語
  • トルコ語
  • ウクライナ語
  • ウルドゥ語
  • ウズベク語
  • ベトナム語
  • ウェルシュ語
話者数選択

メディア内の話者人数(1〜99人)を指定します。

「自動認識」でもよいですが、人数を指定するとより精度が高まります。

タイトル設定

タイトルを設定したい場合は、「オプションでタイトルを入力」にテキストを入れておきます。

タイトル設定は、スピークストリームラインのみで行えます。

まとめ

スピークストリームラインは、メディア(動画・音声)ファイルを解析し、その文字起こし翻訳要約、および分析と提案を一度に行う機能です。

また、この機能をYoutube動画に特化したものがチューブスピークフローです。

利用可能回数は、スピークストリームラインとチューブスピークフローを合わせ、1日3回までです。

利用可能なメディアは、再生時間が30分以下、かつ100MB以下の動画・音声ファイルです。

  • URLをコピーしました!
目次