前回のご面談からちょうど1年後に、音声・言語でのコミュニケーションをご専門とされる森先生に音響班の研究進捗を報告の上、今後の研究の展開について議論しました。
【前回はこちら】
実は面談の前日に、日本音響学会 音声研究会(ASJ-SP)で、音響班の研究進捗を発表してきました。森先生にもその発表をご覧いただいておりました。面談では、その発表に関してより深いディスカッションを行いました。
うつ症状分類モデルの性能向上が課題となっている現状で、どういった特徴量を用いる必要があるか、その選定を行う上での考え方、検証方法などについて相談をしました。
また、昨今で話題になっている、生成AIの音声分野(音声合成といいます)の動向についても話し合いました。森先生の研究チームでは、読み上げ音声で訓練したモデルと対話音声で訓練したモデルを用意し、それぞれの合成音声を聴かせた結果、対話音声で訓練したモデルでは明らかに聞き手の頷きが多かったことを発見しています[1]。これは非常に面白く、私たちのデジタル精神ケアにおいても示唆深い知見であると盛り上がりました。
1. T. Iizuka and H. Mori, “How Does a Spontaneously Speaking Conversational Agent Affect User Behavior?,” in IEEE Access, vol. 10, pp. 111042-111051, 2022, doi: 10.1109/ACCESS.2022.3214977.
今後も先生方にご指導ご鞭撻を頂き、本領域の進展に尽力して参ります。
今後とも本領域をどうぞ宜しくお願い申し上げます。