ITプラットフォームへ移動
特集

益々充実!すぐに使える音声認識AI

  • 2022年9月6日
  • 中小機構 中小企業アドバイザー(経営支援) 野村真実
  • AI
  • 音声認識
益々充実!すぐに使える音声認識AIのサムネイル画像

スマホに向かって、音声操作を試みたことはあるでしょうか?
特別な準備をしなくてもすぐに音楽を流したり、天気予報を聞いたりなどの「お願い事」が出来るようになりました。その背景は、音声の識別にAIのディープラーニングが活用されたことで、音声認識の精度が大きく向上したことによります。
AIを活用した音声認識では具体的に何ができるのか、どのようにビジネスに生かせるのか、具体的な事例とともに紹介していきます。

音声認識AIの導入で実現できること

音声認識AIはいろいろなハードやシステムに組み込まれ、技術的な事を意識しなくても使えるようになりました。下記のような場面で活用されています。

(1)音声のみでの文字入力

音声を発するだけで自動的に文字を判定し、さらには漢字変換まで行い、テキストを作成することが可能となりました。例えば、車での移動中に声だけでメール文章のベースを作るなど、時間短縮になります。また、議事録の自動作成や録音の文字起こしも可能なシステムも登場して便利な時代になりました。

(2)多言語間の通訳・翻訳

円安ということもあり、アフターコロナで外国人観光客が多数訪れるとの予測がありますが、コミュニケーションを取る時に便利なのが多言語間の通訳や翻訳が可能なアプリや音声翻訳機です。まずは自分の言葉が日本語として正しく認識されるのか、テストしてみましょう。

(3)音声での機器の起動・操作指示

音声アシスタント(「Googleアシスタント」や「Siri」など)搭載のスマホやスマートスピーカーなどを通じて、機器の起動や操作支持ができるサービスです。 仕事現場でも手を使わずに音声のみで機器の起動や操作の指示を出すことが可能となりました。

例:製造ロボット操作、空調や照明の切り替え等

音声認識AIの課題

(1)特別な業界用語、自社内スラングなどが認識されない

業界用語や自社内スラング(一般用語ではない自社だけで使う方言)、くだけた話し方などは認識できないケースもあります。正確に認識させたい場合には、なるべく特別な用語を使わずに標準的な言葉ではっきりと話さなければなりません。

(2)複数人の音声が認識されない

複数人が話しているデータのなかから、特定の人の音声のみを聞き分けるのは難しいといわれています。また、雑音やノイズが多い場合も識別精度が下がるため、可能な限りノイズを除去する必要があります。

AI音声認識の導入事例

(1)報告書作成システム

コインパーキングの工事・管理や精算機の選定などの総合管理業務を行っている企業では、現場からスマホの音声入力で報告書を作成しています。これまで現地で業務を行った後、帰社後に事務所の机で報告書の作成を行っていたため、残業増加の要因になっていました。話すだけで入力ができるため、スマートフォンの操作が苦手な方でも、時間をかけずに簡単に報告書作成が行えています。

(2)コールセンター向けシステム

FAQが増加の一途を辿っていたJ社のコールセンターでは、電話音声の文字起こしに加え、質問に応じて自動的に必要なFAQを開くなど、記録など人が行う後作業を減らし、1件あたりの通話時間も短縮できています。また、顧客の会話スピードや声色などから感情を分析し、事前にクレーム防止につなげるといったサービスの活用も検討しています。

(3)議会の議事録作成システム

ある自治体では音声を録音して、テキスト化する作業にも活用されています。手動での文字入力が不要になり、担当者の負担軽減や時間の有効活用につながっています。また、音声データをテキスト化し、モニターに直接表示させる機能で、耳の不自由な市民への対応にも役立てています。

(4)電子カルテシステム

多くの医療現場では、電子カルテの入力を音声で行えるソフトが導入されています。複雑な専門用語も、話すだけで自動入力が可能です。また、看護記録や在宅医療のカルテ作成、紹介状などの文書作成にも役立っています。音声入力であれば、パソコン操作が不慣れな医師も、簡単に入力や文書の作成ができて、時間短縮につながります。

(5)タクシーの接客

スマートフォンやタブレットに搭載されている翻訳アプリなどで海外観光客に対応しているタクシー会社が増えています。また海外の旅行者もアプリやポケット翻訳機で話しかけるケースも増えているようです。

以上、身近になった音声認識AIについて、課題や事例をご報告いたしました。進化の速い分野なので、情報収集のアンテナを立てて、是非ご活用ください。