■3つのチェックポイント
深層学習(ディープラーニング)やビッグデータの活用が進み、音声認識の精度が大きく向上。話した言葉をテキストデータに変換できる「音声文字起こしサービス」が相次いで登場している。会議の内容を振り返ったり、他の人にシェアしたりなど、テレワーク時代の情報共有ツールとして注目されているこれらのサービスは、どこまで実用的なのか。主要な7つのサービスを実際に使い、比較してみた。 (1)認識方式 音声文字起こしサービスを選ぶ際のポイントは3つ。まず重視すべきは音声の「認識方式」だ。進行中の会議の音声をリアルタイムでテキスト化していくものと、アップロードした会議の録音データをテキスト化する2つの方式がある。リアルタイム方式であれば会議中でも直前の発言などを確認できて便利だが、会議の間はインターネットに接続しておく必要がある。 (2)直接編集 生成されたテキストを、サービス上で「直接編集」できるかどうかにも違いがある。特に再生している位置をテキストでハイライト表示できると、後から文字修正する際に便利だ。 (3)保存 さらに、会議の音声やテキストをクラウドに「保存」するかにも違いがある。保存した会議の内容を後から確認したり共有したりできるサービスもある。
■総合的に優れていたのはリコーの「toruno(β版)」
今回比較した音声文字起こしサービスは、正確な議事録を作るにはテキストの修正が必要になるものの、会議の大まかな流れや会話の文脈を後から振り返る用途にはどれも使えそうな印象だ。口語で自由に議論する会議ではなく、文章を読み上げてテキスト化する目的であれば認識精度はさらに高まる。 比較した7つのサービスの中で、使い勝手が総合的に優れていたのは「toruno(β版)」(リコー)だ。パソコンに専用ソフトをインストールする必要はあるが、リアルタイムで音声をテキスト化。会議の途中でも聞き逃した発言などをすぐに読み返せるのは便利だ。 秀逸なのが独自の画面キャプチャー機能。パソコンのディスプレー画面を30秒に1度自動で撮影し、テキストデータと合わせて時系列に保存していく。オンライン会議で画面共有されたスライドや資料などを見過ごしてしまっても、後から確認できるのは他には無い便利機能だ。 torunoはオンライン会議での利用を想定したサービスだが「ICレコーダーの録音データをパソコンで再生しながらtorunoを起動することで、音声認識機能を使うこともできる」(リコー)。現時点では「β版」のサービス(正式版の時期は未定)だが、記録した音声やテキスト、画面キャプチャーを容量無制限で保存できるのも大きな魅力だ。
からの記事と詳細 ( これで会議後の苦痛とオサラバ? 「音声文字起こし」サービス7種類を徹底検証、ベストはこれだ(NIKKEI STYLE) - Yahoo!ニュース - Yahoo!ニュース )
https://ift.tt/3vn2ETh
No comments:
Post a Comment