環境音に対する日本語自由記述文コーパスとベンチマーク分析

岡本悠希, 高道慎之介, 森松亜衣, 渡邊亞椰, 井本桂右, 山下洋一

Abstract: 音の認識合成を大規模言語モデルと接続するためのデータセットの作成が急務である.本研究では,環境音データと,その内容を日本語で自由記述した文から成るオープンコーパスを構築する.本コーパスは環境音と英語自由記述文から成る既存コーパスの日本語訳であるため,英語と日本語を対比させた評価と分析が可能である.本論文は,コーパスの設計指針を述べるとともに,そのベンチマーク結果を分析する.