AIが日本語を学習、新たな言語モデル開発へ東京大学が発表

東京大学、AIによる日本語学習の新手法を開発

東京大学の研究チームは、人工知能（AI）が日本語を効率的に学習するための新たな手法を開発したと発表した。この手法により、従来よりも少ないデータ量で高精度な言語モデルを構築することが可能になるという。

日本語は、漢字、ひらがな、カタカナの混在や、文法的な構造の複雑さから、AIによる学習が難しい言語とされてきた。従来の手法では、大量のテキストデータを必要とし、処理に時間とコストがかかっていた。

今回開発された手法は、日本語の特性を考慮した独自のアルゴリズムを採用。特に、文節構造や助詞の役割を重視することで、少ないデータでも文脈を正確に理解できるようになった。

—

研究チームは、ニュース記事や小説などのテキストを用いて実験を行った。その結果、従来の手法と比較して、約30%少ないデータで同等以上の精度を達成したという。

この技術は、自動翻訳や文章生成、音声認識など、さまざまな分野での応用が期待される。特に、日本語を扱うAIサービスの開発コスト削減につながるとみられる。

AI言語処理の専門家である田中教授は、「この研究は、日本語AIの可能性を広げる画期的な成果だ。特に、リソースの限られた中小企業でも高精度なAIを開発できるようになる点が重要」と評価している。

東京大学は、この研究成果を国際学会で発表し、さらなる技術向上を目指すとしている。