NLP2024
Papers
環境音に対する日本語自由記述文コーパスとベンチマーク分析
岡本悠希
,
高道慎之介
,
森松亜衣
,
渡邊亞椰
,
井本桂右
,
山下洋一
Paper (PDF)
Abstract:
音の認識合成を大規模言語モデルと接続するためのデータセットの作成が急務である.本研究では,環境音データと,その内容を日本語で自由記述した文から成るオープンコーパスを構築する.本コーパスは環境音と英語自由記述文から成る既存コーパスの日本語訳であるため,英語と日本語を対比させた評価と分析が可能である.本論文は,コーパスの設計指針を述べるとともに,そのベンチマーク結果を分析する.