REPORTS

第14回B’AI Book Club報告
Brian Christian, The Alignment Problem: Machine Learning and Human Values (2020)

金 佳榮(B’AI特任研究員)

・日時・場所: 2022年9月27日(火)17:30-19:00 @Zoomミーティング
・使用言語:日本語
・書籍: Brian Christian (2020). The Alignment Problem: Machine Learning and Human Values. W. W. Norton & Company.
・評者:金 佳榮(東京大学大学院情報学環特任研究員)

2022年9月27日、B’AIグローバル・フォーラムのプロジェクトメンバーによる書評会「B’AI Book Club」の第14回が開催された。今回は、特任研究員の金佳榮が、Brian Christianの著書『The Alignment Problem: Machine Learning and Human Values』(2020)を紹介した。

アメリカのノンフィックション作家でプログラマーの著者は、人間社会におけるAIや機械学習のインプリケーションを主要なテーマとして扱っている。本書では、近年AIの課題として指摘される様々な倫理的、哲学的問題を、「alignment problem」というキーワードを用いて説明する。人間は機械にある行動を行ってほしいと望んでその機械が学習する環境をデザインするわけだが、機械は人間の望みを正しく理解することができず、人間の意図とはズレている行動をすることで社会的問題をもたらすことがしばしばある。このような現状を研究者らは「alignment problem」と呼ぶという。著者は、「alignment problem」の解決策として機械に人間の価値や規範を植え付けることはできないかと問いかけ、その実現可能性を検討するために、コンピュータ・サイエンスが参照した心理学の歴史や理論を丁寧に解説する一方で、自身が行った100件近くの専門家インタビューも交えながら議論を進める。

本書は、AI分野で著名な多くの研究者や専門家によって非常に高い評価を受けている。本の意義としては、現在のAI分野で最も差し迫った課題の一つである公平性や透明性をめぐる哲学的問題を、見事な調査を通じて、理論的かつ実践的に議論している点が挙げられる。

書評会では、このような評価を基本的には受け入れた上で、限界や懸念についても話し合った。例えば、議論展開のベースとなっている心理学の理論が具体的に紹介されているのは知識習得の面でも意義があり、それ自体が本書のオリジナリティでもあるが、本を読む人の動機や期待によっては心理学に置かれた比重が過度に思われるかもしれないという意見があった。また、AIに人間のようなイメージを過度に付与することの問題がしばしば指摘されるが、コンピュータ・サイエンスと心理学を密接に結びつける本書の試みがそのような問題を強化しかねないという懸念も示された。一方、「alignment problem」というメインのキーワードでも表しているように、本書はAIの動機と目標を人間のそれと合致させることを目指しているが、人間も完璧な存在ではなくまだ学習中なのに、その人間の目標と判断を理想的なものと前提しているのではないかという指摘もなされた。

ただ、AIが答えを導き出すプロセスがブラックスボックス化されていることが大きな問題として浮き彫りになっている中で、本書がそのプロセスを明らかにするヒントを提供していることは確かである。また、AIの倫理的論点を考察する分野の傾向として、ますます多様な理論的フレームが導入されていることを確認できた点でも有意義だったといえる。