発表・掲載日:2025/03/10 日本語音声基盤モデル「いざなみ」「くしなだ」を公開 -少量の日本語音声データで高性能な音声AIを構築可能に- ポイント 豊かな感情表現を含む6万時間の日本語音声データから2種類の日本語音声基盤モデルを構築 モデルの改良が容易な「いざなみ」と感情認識や音声認識の能力がより高い「くしなだ」を一般公開 少量データを活用した音声AIの構築・普及に貢献 国立研究開発法人 産業技術総合研究所(以下「産総研」という)人工知能研究センター 深山覚 研究チーム長、緒方淳 客員研究員は、高性能な音声AI構築に利用可能な2種類の日本語音声基盤モデル「いざなみ」「くしなだ」を公開しました。 音声基盤モデルとは、音声データを処理・解析するための汎用的なAIモデルで、音声認識や音声感情認識などに応用が進んでいます。音声基盤モデルの構築には、対象とする言語やそれが使われるシーンを想定