「音声認識字幕ちゃん」がスゴイ!! リアルタイム配信でテキスト出力+翻訳する方法

 

とみます(@20tomimasu)です。

 

Twitch配信を初めて、早3ヵ月。

相変わらず、フォロー数は増えない…

 

ので、配信ガジェットにハマりつつあり。w

前回は、Animazeで、リアルタイムで顔の動きをキャラクターに表現させた。

 

今回は、私の音声を、リアルタイムで、テキスト転換し、さらに同時に英語の翻訳まで。

OBSでの設定方法まで、簡単にメモしておきます。

 

開発者は、西村良太工学博士

 

  • 配信 音声 翻訳

で検索すると、この公式サイトの評判が良い。

>>音声認識字幕ちゃん

 

Twitterでも調べてみると、

 

すげぇ。

  • ①音声→活字(テキスト)に、表示させることができる。

他のAPIと組み合わせれば、

  • ②日本語+英語などの表記も可能。

 

早速、導入してみる。

 

音声認識字幕ちゃんのOBSへの導入方法

 

公式サイトに、記載された通りに実施すると、問題なく動作することを確認できた。

>>音声認識字幕ちゃん

 

GoogleのChrome上で、

音声を認識し、テキスト表示させる。

 

それを、OBSのWindow Captureにて切り出すことで、配信上で共有できる。

以下、Streamlabs OBSでの使い方↓

voice-change-to-text210222-1

↑ソースにて、追加するボタンを選択する。

 

voice-change-to-text210222-2

↑ウィンドウのキャプチャーを選択する。

ここで、プラウザソースを選択すると、機能しないので、ご注意を。

(リアルタイムでOBS上に反映できない。)

ウィンドウキャプチャとして、Chromeの画面をクロップ(切り取り)する感じに利用していく。

 

voice-change-to-text210222-3

↑実際の使用画面は、こんな感じ。

OBSとブラウザを両方起動させる。

ウィンドウキャプチャーにて、画面を共有していることを確認できたら、

  • ブラウザの大きさ
  • OBS上の位置やサイズ調整

を行う。

 

その後、OBS上にて、

  • Alt+マウスで拡大・縮小(↕)

にて、キャプチャーを、クロップする(切り取る)ことができる。

これで、タブ画面などの不要な箇所を除外できる。

 

あとは、背景の緑色をクロマキー処理をすればOK。

  • 右クリック→フィルター→クロマキー

(元々の背景が緑色なので、ありがたいね。)

 

これにて、背景が透明に。

便利な時代になったもんだ(*´▽`*)アッパレ。

 

早速、twitch配信に反映してみる

voice-change-to-text210222-4

↑Tomimasu×Fortniteにて。

まず、マイクの音声が認識され、画面下にテキスト表示される。

さらに、英語への翻訳が実施され、少し遅れてから(数秒)、日本語の下に英語が表示された。

 

おぉー。

これでグローバルな配信にも対応できるねん。

 

たまに、誤訳して、分けわからんテキスト表示されるけど。w

 

なので、喋り方や方言などに、注意していく必要がある。

  • 大きい声でゆっくり喋る事。
  • 訛りや方言は、誤認識されやすい。

 

ん?

これに、機械学習を取り入れれば、

より誤認識を減らすことができるのか…

 

というか、すでに導入されている?

  • 日本人のクセや方言→スタンダード表記→英語表記

とかにも、期待できそうね。

(どっかに、ライブラリが存在しそうだが。)

 

その辺の知識も学びつつ。

 

おわりに

 

以上「「音声認識字幕ちゃん」がスゴイ!! リアルタイム配信でテキスト出力+翻訳する方法」でした。

 

3分で実装できるので、ぜひ、お試しあれ。

英語の発音も正しければ、そのまま英語表記されることも可能。

 

ゲームをしながら、日本語→英語の勉強にもなるかもねん。

1日1%の自分アップデートを続けつつ。

 

それでは、また。

「音声認識字幕ちゃん」がスゴイ!! リアルタイム配信でテキスト出力+翻訳する方法” に対して 5 件のコメントがあります

  1. non より:

    こんにちわ!
    導入するために調べてこのブログにたどり着いたのですが
    音声認識字幕ちゃんを起動して、OBSで設定をしたのですがフルスクリーンで表示するゲームをするとうまく反映されません。
    なにか解決方法がありますでしょうか?

    1. とみます より:

      nonさん、初めまして!
      フルスクリーンだと、モニターが専用されてしまうから? ですかね…
      私の場合は、デュアルディスプレイで、左にフルスクリーン(ゲーム)、右にブラウザやOBSなどを開いており、問題なく動作していました。
      環境によって、違うのかもしれません、(シングルモニターでは無いですよね?)

  2. かぅ より:

    はじめまして
    フォートナイトで外国人フレンドと遊ぶときにリアルタイムで翻訳してもらえると通訳変わりになるかな?と思ったのですが、フレンドの話した言葉も反応してくれますか?

    1. とみます より:

      初めまして!
      私の知る限り、マイクで拾った音しか反応しませんね…
      ①相手の声(ゲーム音)→②何か他のツールで会話+翻訳→③テキスト表示かと思います。

      1. かぅ より:

        では、『音声認識字幕ちゃん』だけでは無理そうですね
        ありがとうございます

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です