REPORTS

2023年度第3回BAIRAL研究会
「コンピューターによるユーモアの理解と生成――人間とAIの円滑なコミュニケーションに向けて」報告

大月希望(B’AIリサーチ・アシスタント)

・日時:2023年7月31日(月)18:30-20:00
・場所:Zoomミーティング
・言語:日本語
・ゲストスピーカー:田中康太郎(東京大学大学院情報理工学系研究科修士課程)
・モデレーター:大月希望(B’AIリサーチ・アシスタント)

(イベントの詳細はこちら

2023年7月31日(月)、B’AIグローバル・フォーラムのリサーチ・アシスタントが主催する研究会「BAIRAL」の2023年度第3回がオンラインで開催された。今回は、東京大学大学院情報理工学系研究科修士課程の田中康太郎さんをお招きし、「コンピューターによるユーモアの理解と生成――人間とAIの円滑なコミュニケーションに向けて」というテーマでお話しいただいた。

ユーモアはコミュニケーションにおいて重要であるが、主観性が高く背景知識も必要なため、コンピューターによる理解や生成の研究は進んでいない。田中さんは、SNSでメッセージ伝達に効果的なミーム(ボケて)に着目し、面白いミームの生成や理解が可能なAIを作ることを目指し研究を行っている。今回は、これらの研究内容と大規模生成AIのユーモア能力について考察し、コンピューターによるユーモア処理の現状と課題についてご発表いただいた。

田中さんは、ユーモアの評価手法とデータセットに関する研究で、一貫性のあるミームデータセットを作成した。その作成手法では、ベスト・ワースト・スケーリング(BWS)を用いて人間によるアノテーションを行い、そこで評価の一致度を計算して一貫性のないラベルが付けられたミームを除外した。ユーモア理論に基づく評価モデルを作成するために、画像とキャプション間の不適合を抽出するモジュールを提案した。このモデルは、ユーモア評価タスクにおいて他の比較モデルよりも高い性能を示したが、完全なユーモア理解には至っていない。

近年、GPT-4に代表される大規模言語モデルが注目を集めており、これらのモデルはユーモア理解の基礎力を備えつつある。実際にGPT-4にボケての面白さを説明させたところ、タイムリープや本能寺の変といったキーワードを正しく抽出し、テキストや背景知識に合わせた画像の解釈がなされた。一方で、最新の流行や時事問題を含むユーモアの理解には課題がある。また、状況が複雑になるとテキストや背景知識から画像の解釈を行うことが困難であることも解決すべき点である。さらに、個人差を考慮することや、画像の理解、テキストの理解、背景知識の3点を組み合わせたコンテンツの生成は、ユーモア研究ではまだ十分に議論されておらず、今後取り組むべき課題である。

ディスカッションでは、名誉棄損に当たるようなコンテンツをユーモアとして生成することの是非について質問があがった。AIモデルが高度になるにつれ、どのようなコンテンツを生成すべきかという倫理的な議論が重要になり、既に言語モデルでは爆弾の作り方など危険なコンテンツをフィルタリングする技術が研究・実装されている。田中さんは、画像コンテンツにおいても、倫理的に適切なものを判別する手法の開発が必要であると述べた。他方で、猫が泳ぐといったようなジョークのコンテンツは、ある程度の不適合があるからこそ面白さがある。そのような倫理的な許容範囲はコミュニティによって異なる。そのため、AIモデルを社会実装する際は、各コミュニティの倫理感に合わせて設計可能なモデルを開発していくことが求められると述べた。

また、ユーモアを用いたコミュニケーションの応用例については、田中さんは人間とロボットが協力して作業を行うシナリオをあげた。例えば、家事をする際にロボットが会話から必要なタスクを認識し、スムーズに作業に移ることができる。既存研究では、複数人が一緒に作業をする中でユーモアのあるコミュニケーションによって生産性が上がることが示されている。人間とロボットが協働するシナリオにおいてもユーモアを用いたコミュニケーションが実現できれば、よりスムーズな作業につながる可能性があるという。

ロボットによる人間の行動変容についての議論では、人間が機械からよい成果を得るために機械に合わせた行動をとるなど、人間の行動を変容させる可能性はユーモアにもあるかという質問があった。田中さんからは、ロボットにユーモアを通じたコミュニケーションの練習相手になってもらうなどポジティブな変容の可能性と、反対に人間がユーモアに独自性を見いだせなくなりコミュニケーションでの使用を控えるといったネガティブな可能性の両方が提示された。参加者からは、最近の議論として、ロボットの活動に人間が依存してしまう可能性や人間が持つコミュニケーションスキルを使わなくなる懸念、他方でAIの普及とともに人間が変容することによって経済価値の変化が起こることや有意義な社会になる可能性も指摘された。さらに、コミュニケーションが苦手な人にとってはAIによって生成される多様なユーモアが参考になるといった視点や、分断が多くある現在の社会においてユーモアを介して分断を縮めることができるのではという意見も出され、人間とAIだけでなく人間同士のコミュニケーションについても考える機会となった。