2022.Sep.14
REPORTS第11回 B’AI Book Club 報告
Ricardo Baeza-Yates “Bias on the Web” (2018)
佐野敦子 (B’AIグローバル・フォーラム特任研究員)
・日時・場所:2022年5月31日(火) 17:30-19:00 (JST) @Zoomミーティング
・使用言語:日本語
・論文:Ricardo Baeza-Yates (2018). “Bias on the Web” Communications of the ACM, Vol. 61 No. 6, pp. 54-61.
・評者:佐野敦子
2022年5月31日、B’AI Global Forumのプロジェクトメンバーとその関係者が参加する書評会「B’AI Book Club」の第11回がオンラインで開催された。今回は2018年に『Communications of the ACM』(Association for Computing Machinery)に掲載されたRicardo Baeza-Yatesの論文「Bias on the Web」を紹介した。ACMはコンピュータサイエンス分野で影響力のある国際学会のひとつである。この論文は、データに含まれる様々な偏り、開発者がもつアンコンシャス・バイアスや、利用者の文化的な背景やスキル差等の影響をうけ、Webの表示がいかに偏ったものになっているかを、Webシステムのデータ利用の仕組みをふまえて示している。そして、こうした開発や利用過程で生じる様々なバイアスの対処は、まずそのバイアスの存在に気づくこと、そして開発者・利用者が内部にもっているバイアスがあらわれていることを自覚し、ユーザのニーズに応えるWebシステムをデザインしなければならない、と主張している。
Baeza-Yatesの説明は、論文で示された図「バイアスの悪循環」(Vicious Cycle of Bias)に集約されているといってよい。図では、ユーザの履歴データが含まれるWebバイアスからはじまり、Webシステム内でさらにバイアスが生起・増幅されていることを説明する。そして、それらのバイアスを分類し、それぞれのバイアスによっていかにWeb上の表示に差異が生まれているかを、エビデンスをもって示している。佐野特任研究員は論文の紹介のあとに、技術者はシステムのなかだけでこのバイアスに対処していこうとしており、活用しているデータのバイアスの対応、つまりはユーザのスキルや文化・社会的な差についての方策が考慮されていないことが疑問である、と投げかけた。
この問いに対するメンバーの論点は2つに集約された。まずは、バイアスフリーな空間の作成はオンライン・リアルに関わらずそもそも可能なのだろうか、そしてバイアスという言葉の問題である。
前者については、AIは使用する範囲を限定すべきということでほぼ意見が一致した。例えばディープラーニングは自動的に生成して手がかからないのがメリットであるはずなので、バイアスの影響がない、もしくは影響がない範囲のみに限定して適用すべきである。もしバイアスの影響があれば、いつまでも人の手が入って修正を加えることになり、効率的とはいえないだろう。
後者の言葉の問題については、評者がこの論文を日本語で紹介するときにバイアスをいかに翻訳するかに苦慮したことから議論となった。論文のなかには統計の偏差を意味するバイアス、開発者や利用者がもつ認知的なバイアス、そしてWebに対して反応をするかどうかの貢献度の差、その背景にWebへの慣れやスキルといった個々人のおかれた環境によって生じた差や偏りを意味するバイアスもあった。これらをすべて日本語で「バイアス」と称すると非常に混乱するのは明らかである。とくに、ジェンダーに関わる研究者はバイアスというと、ジェンダー平等の妨げといわれるアンコンシャス・バイアス(無意識のバイアス)を想起し、悪いイメージをもってしまう。だが開発者からみれば、Webの負荷を減らして効率的に早く表示するために、過去の検索履歴を活用し、個々人にカスタマイズして表示をすることで利便化を図った結果、見る人によって異なる内容が表示されるわけであり、バイアスの防止のためにこうした機能を単純に削除するのはデメリットのほうが大きい。
こうした言葉や翻訳によってもたらされるイメージが、現実の理解に影響を及ぼす現象は「人工知能」や「ソーシャルメディア」といった他の用語にも共通する点がある。私たちは、広告やアルゴリズムの関与で実際には内容が限定され、表示順が異なるSNSを、誰でも等しくアクセス可能な「社会的な(social)」な空間として受け止めていないだろうか、また「知能」という言葉からAIが人造人間のような錯覚を起こしていないだろうか。
加えて、Baeza-Yatesも認めているように、この論文に紹介された以外にも、Webの表示に影響を与えるバイアスと称してもよい格差やギャップは他にもあるはずである。例えば、G20のコンサルテーショングループのひとつW20で提示されたスキル、アクセス、リーダーシップのデジタル・ジェンダーギャップ、検閲が入ることでWebに発言できないといった権力の介入の差異による国家間のバイアスも考えられる。
本書評会は、海外の文献を参考にして、日本のAIの発展を考えていくことを目的としている。日本にそういった海外の知見を取り入れる際には、「バイアス」「人工知能」といった言語や翻訳から注視しなければならないことを、Baeza-Yateの論文は改めて示してくれた。そして、非英語圏の出身であるBaeza-Yatesから、Webの英語至上主義に反発をしたこのような論文が示されているということは、開発環境のダイバーシティの推進が、あらゆるバイアスの低減に有効であることも示してくれたのではなかろうか。