NISTEP注目科学技術 - 2023_E607
概要
音声認識技術のめざましい進歩は、様々な国のことばを自動的にテキスト化し、その誤りもかなり少なくなってきている。これも学習データの活用次第であることは明かなところだ。そうした基礎的な技術は、では実際に応用して活用されているのかという点で、まだまだ改革の余地があるものと目される。例えば、Web上に様々なデジタルアーカイブコンテンツが日々増加しているが、そうしたコンテンツに如何にしてアクセスしているのが現状かというと相変わらずテキスト入力によりクエリを確定し、それによる検索であるとも言える。これは言葉、例えば漢字・平仮名等々での入力を知らないとデータに辿りつけないことが多い。オンライン上で、例えば古典籍の書名を正確に覚えて入力できるかというと甚だ疑わしいし、海外のユーザにとって、日本語という壁がそうしたデータベースへのアクセスを阻害しているといえる。いま音声入力によりWeb上のデータにアクセスするようなツール開発はまだなされていないし、いち早く導入することは海外にも展開できることになると考える。情報通信研究機構が進めているVoiceTeraなどの精度は大変高い物があり、一方で国会図書館や国文学研究資料館がもつ著者・書物データを用いて学習させれば、音声で書物に辿りつけるのではないか。
キーワード
音声認識技術 / デジタルアーカイブ / 検索技術
ID | 2023_E607 |
---|---|
調査回 | 2023 |
注目/兆し | 注目 |
所属機関 | 大学 |
専門分野 | その他 |
専門度 | 高 |
実現時期 | 5年未満 |
分析データ 推定科研費審査区分(中区分) | 62 (応用情報学) |
分析データ クラスタ | 16 (言語学/言語教育) |
研究段階
既に国文学研究資料館ではデータの整備をすすめ、音声認識に繋がる機関との共同研究を進めるべく館内手続き(知財の提供)を進めている。その精度やイントネーションなどの点での協力機関も必要となるはずで、こうした試みを国語研究所にも話をしている段階にある。
インパクト
学術の世界で、検索のためのクエリが文字である必要もなくなれば、うろ覚えの段階での市民も活用できることになる。既存産業への寄与であるとともに他分野への波及効果も高いものと目される。
必要な要素
-