講演会での話や会議の会話などを録音し、あとから文字にする「テープ起こし」は、しばしば膨大な時間を要する。負担の大きいそんな作業を軽くするサービスを、電子書籍の取次会社が始めた。
話し手の言葉をその場で自動的に文字化し、人工知能(AI)を使って要約もするという内容で、議事録などの作成が頻繁にある企業や官庁での導入が見込まれそうだ。
新サービスは、「メディアドゥ」(東京、新名新社長)が提供する。インターネットに接続したマイク付きのパソコンやタブレット、スマートフォンで人の声を認識し、グーグルの音声認識システムを使ってその場で自動的に文字に変換され、画面に表示される。
変換ミスがあった場合、その場でマーカーすることができ、音声入力が終わった後、該当箇所だけを聞いて修正することもできる。
こうして出来上がった文章はさらに、メディアドゥの関連会社が開発したAI技術を使って、瞬時に要約することができる。要約の分量も指摘することができる。
同社の本業は電子書籍関連の事業。書籍など、大量の文字情報を要約したコンテンツの商品化などを検討する中で、その前段として会議の議事録などを要約するサービスを思いついたという。自動文字起こし技術とセットにすることで、具体的な商品化への道筋が開けた。
用途は講演会の記録や会議の議事録などの作成を想定。例えば会議では、複数人が話しても自動文字起こしと要約が機能する。
同社は文字化や要約の精度を検証するため、徳島県と実証実験に取り組んできた。県は2018年3月末までの約5カ月間、知事の定例記者会見でこのサービスを活用。総合政策課によると、会見内容を文字起こしから公式サイトにアップするのに、これまでは8~10時間かかったのが、半分程度で済むようになったという。
要約に関する実験では、県の有識者会議の議事録を活用。要約の精度を確かめた。
県はいずれも効果があったと評価。知事会見について、2018年度から本格導入する。
メディアドゥによると、技術的には多言語による音声入力・文字化も可能で、今後、商品化を検討する余地があるという。
ハフポスト日本版の編集部員ら3人は4月2日、サービスを体験した。3人はパソコンやスマートフォンにつないだマイクを装着し、災害時における会社の対応や記事のテーマについて議論した。
3人の声はそれぞれのマイクによって別々に認識され、画面上でも話者と内容が一致。編集部員の1人は早口だったが、音声認識と文字変換はほとんど正確だった。
実際に話してから画面上に文字として表示されるまではややタイムラグがあったものの、変換が正確だったこともあり、あまり気にならなかった。