第14回教育におけるCBTの活用状況と今後
2020年はフランスでは高校生の卒業資格に値するバカロレアの筆記試験が中止となり、平常点のみでの評価となった。アメリカでは大学受験の際に学力判断の指標になるSAT(Scholastic Assessment Test)が中止となった。コロナ禍では、テストのために同じ会場に集まり、紙のテストを受ける、ということへの抵抗感が広がっている。日本でも大手予備校が模擬試験の会場実施を中止、または定員を大幅削減とし、これから始まる入試本番でも影響は避けられそうにない。
その代替手段として改めて脚光を浴びつつあるのが、CBT(Computer Based Testing:コンピュータを利用した試験)である。
CBTとはなにか?
まず、CBTとはなにか、について説明したい。CBTは文字通りコンピュータ(パソコンに加え、タブレット等のデバイスも含む)を使ったテスト形式を指す。テストセンター等の外部会場でテストを受ける場合、自宅等の各自好きな場所からテストを受ける場合、双方を指す事が多いが、前者を狭義のCBT、後者をIBT(Internet Based Testing)と呼び、分けて考えることもある。以降、広義のCBTとしてコンピュータを使ったテスト形式全般を対象に記載する。
CBTのメリット
CBTによるメリットの代表的なものは下記のとおりである。紙を使う、という制約をなくすことで生まれるメリットには例えば以下のようなものがある。
逆にデメリットとしては以下のようなものがある。
では、CBTは紙がパソコンに変わっただけ、なのだろうか?実は、出題自体も柔軟に行うことでさらなるメリットを享受することが可能になる。
CBTにCATを組み合わせることで更にメリットは増える
CBTはコンピュータを使い実施する。その利点を活かすと、CAT (Computerized Adaptive Testing:個別最適型テスト)を導入することができるようになる。
CATは、「受験者の理解度に応じ、出題する問題をアダプティブに変更することができる出題形式」と言える。
算数のテストを想定して考えてみよう。あるテストにおいて「通分」の問題を間違えた受験生には、例えば「最小公倍数」の問題を出題し、どこまで理解しているかを測る。逆に、「通分」を正解した受験生には、より高度な「異分母の分数の足し算」を出題し、どこまで進んだ理解ができているかを測る。
それにより、一律出題のテストでは「最小公倍数」「通分」「異分母の分数の足し算」をそれぞれテストしないと全員のちからが正しく測れなかったのが、一度のテストで短時間で一人ひとりのちからを測ることができるようになる。
そんなCATのメリットを確認してみよう。
- 受験時間が短縮される(後述のTOEICテストの例が顕著)。
- 受験者ごとに最適な問題が出題でき、広い範囲の理解度が個別最適化された形で測定できる。
- IRT(Item Response Theory:項目応答理論、異なる問題を解いても同じ軸上でちからを測ることができる方法)を組み合わせることで、異なる問題を解いた受験生同士に対して一律に比較可能なスコアを算出することも可能となる。
- いつ、どこで受けても、高い精度のスコアが算出できる。
逆にデメリットはあるだろうか?
しっかりと設計、構築されたテストであれば、受験者にとってデメリットはないともいえる。一方でしっかりと準備する、ということが裏を返せば実施者にとってのデメリットともなりうる。
実施者にとってのCATのデメリットとしては、大量の問題データベースを構築する必要があることである。紙であれば、極論、テストで印刷して使う数問の問題のみを作成しておけば良い。一方で、CATの場合は誰にも使われないかもしれない問題を含め、多くを準備する必要がある。
更に、IRTを導入する場合については、各問題の難易度の信頼性を高めるため、数百から数千人単位で事前に解いてもらってデータを集め、各問題の難易度をスコア化しておく必要がある。
では、実際にCBT、CAT付きCBTの事例はあるのだろうか?
CBTを用いた試験の例
世界に目を向けると多くの事例があるが、中でも日本人に馴染み深い試験を例としてあげる。
- TOEIC(国際ビジネスコミュニケーション協会が実施する英語試験。社員の英語力の目安にするために受験させる企業が多い)
- TOEFL(「英語を母国語としない人の英語力」を判定するテスト。英語圏の多くの大学が留学希望者の英語能力測定のために利用している)
- 英検CBT(「実用英語技能検定」。国内最大規模の英語検定試験)
- SPI(リクルート社が提供している適性検査。 企業が就職希望者の能力を測るために用いている)
- GMAT(MBA(経営大学院)への入学希望者を対象に行われる入学適性テスト)
- 外務員資格試験(国家試験。なお、外務員になるためには試験のほかに銀行や証券会社に勤務し、届け出する必要がある。)
- 米国公認管理会計士試験(米国IMA(管理会計士協会)が認定するプロフェッショナル資格)
上記CBTテストの一部は、CATも採用している。例えばTOEICは、CATを採用することで、皆が違う問題を解きながらも信頼性のあるスコアを提供している。CATの仕組みを導入することで試験時間を2時間から1時間に短縮することに成功したと発表している。(https://www.iibc-global.org/iibc/press/2019/p139.html)
中学生・高校生の学力測定にもCBTが採用され始めている
では、中学生や高校生の学力を測る公式テスト、という観点ではどうだろうか。国内ではあまり聞かないが、海外に目を向けると大規模テストでの事例も存在する。
一つがPISA(Programme for International Student Assessment:国際的な学習到達度に関する調査)である。PISAは15歳から16歳の生徒を各国で抽出(=悉皆調査ではなく)して調査を行うアセスメントテストである。2015年は日本では6,852人が抽出された。
従来は各国のICT環境等の状況に合わせて、オンライン方式や、オフラインPC方式、紙実施方式から選択し、どの国でもほぼ同一の問題を受験可能としていたが、2015年からは原則CBT方式へと移行し、日本でも2015年にCBTで実施された。PISAで使用される問題には難易度やその問題で測りたい能力が定義されている。
PISAのCBTでは、選択肢形式問題、プルダウンからの選択形式に加え、キーボードを使った数値入力形式や自由記述形式も取り入れられた。なお、自由記述形式問題を組み込むことで、CBTのメリットの一つである即時採点が現状はできなくなるため、その点は注意が必要である。
また、アメリカの全米学力調査(NAEP)でもCBTが活用されつつある。
NAEPは1969年に開始された調査で、生徒個人ではなく、アメリカの子供たちの全体としての学力を調査する目的で行われている。生徒個人や学校単位での結果にはアクセスできないようにしており、違反者には罰則も設けられている。目的により異なるが、対象が数千〜数万人の抽出調査である。
そのNAEPで、2016年にキーボード付きタブレットにて数学、読解がCBTで試行実施され、問題の一部にCBTならではの音声や映像を使った問題も組み込みまれた。2016年以降、紙とコンピュータ、それぞれを使った受験者における結果の有意差有無の調査のため、両方式を活用した調査が続いている。2019年にはほとんどの生徒がCBTで受験する段階まで進んでいる。主催者のNCESは、近い将来にNAEPをCBTで完全実施する方向で検討を進めている。
(参考:https://nces.ed.gov/nationsreportcard/dba/)
他にも、文部科学省による委託調査事業である「学校のICT環境を活用したCBTに求められる諸条件等の調査研究(市場調査)」の結果に記載の通り、オーストラリア、オランダ、フランス、スウェーデンなど、多くの国における学力調査でCBTが実際に導入されている。
(参考:https://www.mext.go.jp/content/20200727-mxt_chousa02-000008941_1.pdf)
日本におけるCBT活用の状況は?
先述の通り、2015年のPISAは日本でもCBTで実施された。では日本で行われる他の学力テストにおける状況はどうだろうか?
以前から文部科学省もCBTによるテストを検討している。2015年、「高大接続システム改革会議」において、
>「平成36年度から始まると想定される次期学習指導要領のもとでのテストからCBTを実施することとし、現行学習指導要領のもとでの平成32~35年度間については、CBTの試行に取り組む。」
と公表していた。
そして実際に足元の2020年には「全国的な学力調査のCBT化検討ワーキンググループ」を開始、10月29日までに計6回の議論が行われている。2021年度に向けては「全国学力・学習状況調査のCBT化に向けた取組」として、約1万人の児童生徒を対象とした試行に6億円の概算要求を行っている。
コロナの影響もあり、2020年度にはGIGAスクール構想が一気に加速。全国の小中学校で一人一台の端末が揃う方向で進んでいる。それを活用すべく、急ピッチでCBTの検討も進んでいるという状況だ。
入試におけるCBTの利用
まだまだ、入試自体へのCBTの活用事例は聞こえてこないが、それも時間の問題であると思われる。入試のために遠方から会場に赴き、体調が悪くとも、天候が悪くとも、決められた時間に受験をする。そしてそれができなければ、不合格となる。そのような状況には無理があり、不公平である、ということが、奇しくもコロナの影響で声高に叫ばれ始めている。
2020年度の入試を見ても、冒頭に記載の通り米国ではSAT(世界複数会場で実施の紙受験)が中止され、各大学は学力テストの結果無しで合格判定を出す方向で動いている。フランスでもバカロレアの学力テスト(同、紙受験)が中止となり、学習姿勢などのほか項目での合格判定を出す方向である。賛否はあるものの、もともと学力一本勝負ではなく、高校での活動やエッセイなどの様々な情報を元に合否を判断していたため、このような対応が可能となったと言える。
一方で中国は7月に、韓国は12月に、会場実施での大学入試のための全国統一テストが施行された。日本も、1月に会場実施での「大学入学共通テスト」が予定されている。(日本では総合型選抜(旧AO入試)が広まってきているが、)歴史的に学力テストのみで合否を決めるタイプの入試が主流である国々では、中止という判断は難しかったということだろう。
しかしその日本でも、民間では先んじて大学入試に向けた模擬試験でCBTの活用が始まった。まだCAT化まではできていないものの、駿台予備学校とatama plus社(駿台atama+模試)、河合塾(全統模試のweb受験サービス)等、CBTによる模擬試験が始まっている。
いずれにせよ、徐々に来るCBT化の波は大きくなる一方と考えられる。今後の変化を注視しつつ、入試そのものの変化にも期待していきたい。
- 第30回 教育最前線 – 国内の塾における EdTech の価値事例「生徒インタビュー」編「中学内容を先取りする小学生」
- 第29回教育最前線 – 国内の塾におけるEdTech の価値事例「次世代型個別指導 おがわ塾」編「教員歴36 年の豊富な経験から各生徒にとって心地いい学習を提供し自学力を育む」
- 第28回教育最前線 – 国内の塾におけるEdTech の価値事例「進学塾 MUGEN」編「無限の可能性を引き出し、夢を実現する」
- 第27回教育最前線 – 国内の塾におけるEdTech の価値事例「俊英館Dreaven」編
- 第26回教育最前線 – 国内の塾における EdTech の価値事例「生徒インタビュー」編「高校内容を先取りする中学生3」
- 第25回教育最前線 – 国内の塾における EdTech の価値事例「練成会PLUS」編
- 第24回教育最前線 – 国内の塾におけるEdTechの価値事例「生徒インタビュー」編「高校内容を先取りする中学生2」
- 第23回 教育最前線 – 国内の塾におけるEdTech の価値事例「寺小屋グループ」編
- 第22回教育最前線 – 国内の塾における EdTech の価値事例「生徒インタビュー」編「高校内容を先取りする中学生」
- 第21回 教育最前線 – 国内の塾における EdTech の価値事例「M 進(岩手県)」編
- 第20回教育最前線 – 国内の塾におけるEdTechの価値事例「練成会グループ 3.14コミュニティ」編
- 第19回SXSW EDU 2022参加レポート
- 第18回教育最前線 – 国内の塾におけるEdTechの価値事例「野田塾」編
- 第17回atama+ EdTech研究所主催 報道関係者向けセミナーレポート
- 第16回教育最前線 – 国内の塾におけるEdTechの価値事例 「超個別指導塾まつがく」編
- 第15回グローバルEdTechユニコーン28社まとめ
- 第14回教育におけるCBTの活用状況と今後
- 第13回2020年上期にユニコーンになったEdTech系企業4社
- 第12回 教育機関におけるオンライン試験の変遷と現状
- 第11回 OECD調査に基づく諸外国のEdTech環境調査まとめ