中原裕彦の発言 (内閣委員会)
⚠️ コピーしたテキストを転載する際は、転載元URL(kokkai-data.com)および原典URL(kokkai.ndl.go.jp)を必ず残してください。発言内容の改変・出典削除は禁止です。
詳細は利用規約をご確認ください。
○政府参考人(中原裕彦君) お答え申し上げます。
文化庁におきましては、国立国語研究所が過去に整備しました現代日本語書き言葉均衡コーパスにつきまして、令和六年度から五年計画で直近二十年分の約一億語分のデータを追加しまして、言語コーパスの充実を図る事業というのを実施させていただいてございます。
この事業は、現代日本語の書き言葉の縮図となりますよう、統計的手法によりまして対象を選択し、品詞名、用法、修飾関係、意味などの情報を付与したデータベースを作成するものでございます。これらのデータは、信頼度が高く、大規模言語モデルを基にAIで生成される日本語の的確性を高めるファインチューニングなどでの活用も想定しております。
今後も、本事業の着実な実施に向けて取り組んでまいります。
また、方言と申しますのは、その地域の文化の基盤を成すものでございますけれども、その衰退が著しく、消滅の危機にあるとユネスコに認定されているものもございます。そのため、文化庁におきましては、そうした方言の保存、継承にも取り組み、記録を蓄積してまいりました。
加えて、全国的に方言の衰退が進んでいる現状を踏まえまして、今後は大規模言語モデルでの活用も想定した全国方言の記録及びデータベースの作成の計画にも着手してまいりたいと存じます。