REPORTS

ワークショップ「Rによるデータ解析入門」報告

金佳榮(B’AIグローバル・フォーラム特任研究員)

・日時:2021年 4月2日, 7日, 9日, 14日, 16日 10:00~12:00
・形式:Zoomミーティング
・言語:日本語
(ワークショップの詳細はこちら

2021年4月、B’AIグローバル・フォーラムはザ・カーペントリーズとの共催で、東京大学の大学院生と研究員を対象にしたハンズオン型ワークショップ「Rによるデータ解析入門」を開催した。ザ・カーペントリーズはデータ分析やプログラミングスキルの教育活動をする国際NPOで、MITをはじめとする大学や主要政府機関など、さまざまな組織とともに活動を広げている。今回のワークショップは、ザ・カーペントリーズを構成する3つのグループの1つであるソフトウェア・カーペントリー日本語チームからインストラクターらが参加してRという統計分析ツールの使い方を初心者である受講者に教えるという内容で、新型コロナウイルス感染症拡大という状況のためZoomを用いてオンライン上で開催された。

 

本ワークショップで教えられたRとは、近年データ解析と可視化に広く使われているオープンソースのプログラミング言語の一つで、線形・非線形モデリング、古典的な統計検定、時系列分析、分類、クラスタリングなど多様な統計手法とグラフィック手法を提供する。Rを使うメリットについてインストラクターは、豊富な統計解析のプログラムがインターネット上に無料で公開されていること、および公開されているRコードを使うので統計解析の再現性が高く、そのため解析結果の信憑性も高いということ、また論文などに掲載できる品質のグラフを簡単に作成できることなどを挙げた。

 

ワークショップは全5回(1回に2時間)構成で行われ、毎回11-14人の受講者とカーペントリー側からインストラクター2人、ヘルパー4人程度が参加した。ここで受講者の専門を見てみると、計量社会学、教育学、社会心理学、社会情報学、アート、ゲームなど多岐に渡っており、近年多様な研究分野でデータ解析への関心が高まっていることが伺える。

 

初回はオリエンテーション・セッションで、まずインストラクターがRについて紹介し、その後受講者のパソコンにRおよびRスタジオ(Rを使いやすくする無料ソフトウェア)がうまくインストールされたか確認するなど、事前準備の時間が設けられた。そして、2回目のセッションから、Rスタジオを用いて本格的なRの実習に入った。最初に受講者は最も基礎的な知識として変数と関数について学び、予め用意されたデータセットと様々な関数を使ってデータを整理する方法や必要なデータだけを抽出する方法、またそのデータを論文などに使える品質のグラフとしてビジュアル化する方法などを習得した。最後のセッションではこれまで学んだ内容をまとめておさらいする時間が設けられ、Rについての受講者の理解がより深められた。

 

<図1> Rスタジオの画面

 

ここでワークショップの進め方について少し具体的に振り返ると、まずRスタジオとは、コードを書く場所(エディタ)とそれを実行するプログラム(R)が合わさった「統合開発環境(IDE = Integrated Development Environment)」と呼ばれるソフトウェアのことである。最初に起動すると画面にエディタ(図1の左上)やコンソール(図1の左下)といったスペースが表示され、エディタに変数や関数の組み合わせでつくられるコードを入力し実行させると計算の結果や必要なデータの抽出結果がコンソールに表示される仕組みとなっている。ワークショップは、インストラクターが打つのと同じコードを同時に自分のパソコンで打って、同じ結果が得られるかを確認する「ライブコーディング」という手法で進められた。ただこれだけだとコードについて理解できていなくてもコピーアンドペーストで同じ結果が得られてしまうので、インストラクターは関数ごとにクイズを出し、受講者自らちゃんとコードがつくれるかを確認した。この段階でうまくいかない人はヘルパーによってブレイクアウトルームに誘導され、個別に説明を受けた。

 

今回一つ大きな難点だったのがオンラインという環境である。そもそもこのワークショップは講師が一方的にレクチャーをするものではなく実習型で、本来なら参加者全員が同じ場所に集まって行う形式であった。だが、パンデミックという状況下ではそれが難しく、オンライン上で行うことになり、環境の制約を補完する対策としてZoomの反応機能やチャット、ブレイクアウトルームなどの積極的な活用が試みられたが、どうしても質問がしづらかったり例えばデータセットのダウンロードなどがうまくいかなかった人へのサポートが難しかったりなどの問題が残った。毎回のセッションの後にカーペントリー側がアンケートを取り、受講者からのフィードバックを次回の運営に反映したので、幸い3回目からは問題点が大きく改善されたが、全回を通して言うと、コロナを契機に近年一般的となっているオンラインイベントというのは、メリットが多い一方でやはり限界も多くあるということを改めて実感する機会となったと言うことができる。

 

全てのワークショップが終了した後にB’AIが実施したアンケートでは、「進め方がわかりづらく、質問しづらい雰囲気だった」と、オンラインの難しさが伺える指摘もあったが、全体的にはワークショップに対する満足度が非常に高く、「Rは初めてだが、5回の授業を通じて入門のことが把握できた」「Rを使いこなしている人は初心者が分からないところに気づかないことが多いが、今回はどんなに簡単な問題でもいちいち回答してくれてとても感動した」「内容の構成・運営とも素晴らしかった」などのコメントが寄せられた。今後このようなワークショップが企画されればぜひまた参加したいという声もあり、今回のワークショップを企画した一定の意義を感じることができた。