スタティック
フォートトークの Ver.0.98.117にて、「スピークストリームライン」というAI機能が実装されました。
これはメディア(動画・音声)の文字起こし、翻訳、要約、および分析と提案を一度に行うことができる機能です。
また、その機能をYoutube動画に特化した「チューブスピークフロー」も同時に実装されました。
この記事ではその2つを紹介します。
スピークストリームラインとは
スピークストリームラインは、指定したメディア(動画・音声)を解析し、その文字起こし、翻訳、要約、および分析と提案を一度に行う機能です。
文字起こしの結果は、話者や発話ごとに表示されるため、複数話者の会話の際にも大きく役立ちます。
また、翻訳は解析する言語(翻訳元)が90言語、翻訳先が75言語に対応しています。
さらに、メディアの内容の要約と分析・提案も作成可能です。
スピークストリームラインの使い方
以下に「スピークストリームライン」を使い方を記します。
「追加機能」の「AIコンテンツエンハンス – スタティック」をタップします。
「TransLingual Suit」の「スピークストリームライン」をタップします。
すると、スピークストリームラインの画面が表示されます。
メディアの解析をする前に、まず設定を行います。
右上の「設定」メニュー(歯車ボタン)を表示し、以下の設定をします。
- 解析する主要言語選択
-
メディア内で主に話されている言語を指定します。
- 翻訳先の言語選択
-
翻訳の結果に用いたい言語を指定します。
- 話者数選択
-
メディア内の、発話者の人数を指定します。
また、タイトルを付けたい場合は、タイトル入力欄にテキストを入力します。
設定の詳細は以下の項目をご覧くださいにゃ
これらの設定は、メディアの読込み前に行う必要あります。
「選択・生成開始」ボタンをタップし、メディア(音声・動画)ファイルを選択します。
メディアとして読込み可能なファイル形式は以下です。
メディアを選択すると、一覧にセクションが作成され、処理が始まります。
各セクションには以下の内容が表示されます。
- タイトル
-
読み込んだメディアのファイル名、またはタイトル入力欄に入れた内容が表示されます
- 再生時間
-
メディアの再生時間が表示されます。(ステータスが「完了」になった後に表示されます)
- ステータス
-
処理状況が「待機中」>「処理中」>「完了」の順に表示されます。
- 開始時間
-
セクションを作成した時間が表示されます。
作成したセクションはサーバに保存されるため、複数端末で利用可能です。また、他のAI機能と違い、ログアウトしても削除されません。
今のところ、一度作成したセクションは削除できません。
処理が終わるとステータスが「完了」に変わります。
データはサーバーに保存されるため、処理中に他の画面に移動したり、フォートトークを終了しても処理は継続されます。
解析完了後にセクションをタップすると、結果画面が表示されます。
結果画面の構成
結果画面は、再生プレイヤー(①)と、結果テキストビュー(②)の2つで構成されています。
- 再生プレイヤー
-
読み込んだメディアが表示されます。
- 結果テキストビュー
-
処理結果のテキストが表示されます。
結果テキストビューには、以下の4つのタブがあります。
- 話者解析テキスト
- 翻訳テキスト
- 要約テキスト
- 総合的な分析と提案
「話者解析テキスト」
文字起こしの内容が、話者ごと、発話ごとに区切られて表示されます。
各発話には、以下の内容が表示されます。
- 時間
-
動画のどの区間に当たるが「s(数)」で表示されます。
- 話者
-
話者ナンバーが表示されます。(同じナンバーは同じ話者を表します)
- テキスト
-
発話内容のテキストが表示されます。
また、各発話をタップすると、該当箇所が再生プレイヤーで再生されます。
「翻訳テキスト」
話者解析テキストが、「翻訳先の言語選択」で指定した言語で表示されます。
「要約テキスト」
メディア全体の要約文が表示されます。
表示をするには「要約はこちらをタップ」を押します。
「総合的な分析と提案」
メディアの内容をAIが解析し、総合的な分析と提案が表示されます。
表示をするには「総合的な分析と提案はこちらをタップ」を押します。
結果内容のエクスポート
結果内容をエクスポート(保存)するには、右上の共有ボタンをタップし、エクスポートしたいものを選択します。
- 話者解析HTML
-
「話者解析テキスト」を html 形式で保存します。
- 翻訳HTML
-
「翻訳テキスト」を html 形式で保存します。
- 要約テキスト
-
「要約テキスト」をテキスト形式で保存します。
- 総合的な分析と提案
-
「総合的な分析と提案」をテキスト形式で保存します。
- メディア
-
解析に使ったメディア(動画・音声)をMP4形式で保存します。
トランスコードし直されるため、読み込んだメディアとは別のものになります。
チューブスピークフローの使い方
「スピークストリームライン」の機能をYoutube動画に特化したのが、チューブスピークフローです。
使い方はスピークストリームラインとほぼ同じあるため、異なる点のみを以下に記します。
スピークストリームラインとの違い
- 起動方法
-
起動は「AIコンテンツエンハンス – スタティック」の「チューブスピークフロー」から行います。
- 規約への同意
-
初回時に「利用規約」が表示されるので、内容確認後に「同意する」をタップします。
すると、チューブスピークフローシステムの画面が表示されます。
規約に同意すると、AIスタティックの項目に、チューブスピークフローの「詳細」が表示されるようになります。
- YoutubeのURLを入力
-
メディアの解析をするには、入力欄にYoutubeのURLを入れます。
利用制限などについて
スピークストリームラインとチューブスピークフローには、以下のような利用制限などがあります。
- 利用可能回数
-
スピークストリームラインとチューブスピークフローは、両方合わせて1日3回まで利用可能です。
利用回数が3回を超ると、以下のようなメッセージが表示されます。
- 利用可能なメディアの容量
-
利用可能なメディアは、再生時間が30分以下かつ100MB以下の、動画または音声ファイルです。
その上限を超えたファイルを読み込むと、ステータスに「失敗」と表示されます。(その場合も1回利用とカウントされます)
また、チューブスピークフローでは、以下のようなメッセージが表示されます。
メディア解析の設定
メディア解析の設定には以下の2つがあります。
「設定」メニュー
一覧画面右上の「設定」メニューの項目は以下のようになっています。
- 解析する主要言語選択
-
メディアを解析する主要言語を100言語(自動認識を含む)から選択できます。
「自動認識」でもよいですが、言語を指定するとより精度が高まります。
「解析する主要言語」の内訳
- 自動認識
- 日本語
- 英語
- 中国語
- ドイツ語
- スペイン語
- ロシア語
- 韓国語
- フランス語
- ポルトガル語
- トルコ語
- ポーランド語
- カタロニア語
- オランダ語
- アラビア語
- スウェーデン語
- イタリア語
- インドネシア語
- ヒンディー語
- フィンランド語
- ベトナム語
- ヘブライ語
- ウクライナ語
- ギリシャ語
- マレー語
- チェコ語
- ルーマニア語
- デンマーク語
- ハンガリー語
- タミル語
- ノルウェー語
- タイ語
- ウルドゥ語
- クロアチア語
- ブルガリア語
- リトアニア語
- ラテン語
- マオリ語
- マラヤーラム語
- ウェールズ語
- スロバキア語
- テルグ語
- ペルシャ語
- ラトビア語
- ベンガル語
- セルビア語
- アゼルバイジャン語
- スロベニア語
- カンナダ語
- エストニア語
- マケドニア語
- ブルトン語
- バスク語
- アイスランド語
- アルメニア語
- ネパール語
- モンゴル語
- ボスニア語
- カザフ語
- アルバニア語
- スワヒリ語
- ガリシア語
- マラーティー語
- パンジャブ語
- シンハラ語
- クメール語
- ショナ語
- ヨルバ語
- ソマリ語
- アフリカーンス語
- オクシタン語
- ジョージア語
- ベラルーシ語
- タジク語
- シンディ語
- グジャラート語
- アムハラ語
- イディッシュ語
- ラオ語
- ウズベク語
- フェロー語
- ハイチ語
- パシュト語
- トルクメン語
- ニーノシュク語
- マルタ語
- サンスクリット語
- ルクセンブルク語
- ミャンマー語
- チベット語
- タガログ語
- マダガスカル語
- アッサム語
- タタール語
- ハワイ語
- リンガラ語
- ハウサ語
- バシキール語
- ジャワ語
- スンダ語
- 翻訳先の言語選択
-
翻訳先の言語を全75言語から選択できます。
「翻訳先の言語」の内訳
- 日本語
- アフリカーンス語
- アルバニア語
- アムハラ語
- アラビア語
- アルメニア語
- アゼルバイジャン語
- ベンガル語
- ボスニア語
- ブルガリア語
- カタロニア語
- 中国語(簡体字)
- 中国語(繁体字)
- クロアチア語
- チェコ語
- デンマーク語
- ダリ語
- オランダ語
- 英語
- エストニア語
- ペルシャ語
- フィリピノ、タガログ語
- フィンランド語
- フランス語
- フランス語(カナダ)
- ジョージア語
- ドイツ語
- ギリシャ語
- グジャラート語
- ハイチ語
- ハウサ語
- ヘブライ語
- ヒンディー語
- ハンガリー語
- アイスランド語
- インドネシア語
- アイルランド語
- イタリア語
- カンナダ語
- カザフ語
- 韓国語
- ラトビア語
- リトアニア語
- マケドニア語
- マレー語
- マラヤーラム語
- マルタ語
- マラーティー語
- モンゴル語
- ノルウェー語(ブークモール)
- パシュトー語
- ポーランド語
- ポルトガル語(ブラジル)
- ポルトガル語(ポルトガル)
- パンジャーブ語
- ルーマニア語
- ロシア語
- セルビア語
- シンハラ語
- スロバキア語
- スロベニア語
- ソマリ語
- スペイン語
- スペイン語(メキシコ)
- スワヒリ語
- スウェーデン語
- タミル語
- テルグ語
- タイ語
- トルコ語
- ウクライナ語
- ウルドゥ語
- ウズベク語
- ベトナム語
- ウェルシュ語
- 話者数選択
-
メディア内の話者人数(1〜99人)を指定します。
「自動認識」でもよいですが、人数を指定するとより精度が高まります。
タイトル設定
タイトルを設定したい場合は、「オプションでタイトルを入力」にテキストを入れておきます。
タイトル設定は、スピークストリームラインのみで行えます。
まとめ
スピークストリームラインは、メディア(動画・音声)ファイルを解析し、その文字起こし、翻訳、要約、および分析と提案を一度に行う機能です。
また、この機能をYoutube動画に特化したものがチューブスピークフローです。
利用可能回数は、スピークストリームラインとチューブスピークフローを合わせ、1日3回までです。
利用可能なメディアは、再生時間が30分以下、かつ100MB以下の動画・音声ファイルです。