AIが採点する時代でも、学生は「先生の評価」を求める？〜大学生159名の実験から見えたこと〜 |TechnoProducer株式会社|

この記事の内容

AIの採点は信頼できる？
AIと人間の評価を比較した実験
学生はAIと人間の採点を見分けられたのか
AIによる採点が教育現場で使われるための条件
なぜ人は「人間の評価」に納得するのか　
- このコラムのまとめ

AIの採点は信頼できる？

近年、教育現場においても採点やフィードバックにAIの導入が進んでいます。
しかし、AIによる採点は効率性や一貫性といった利点がある一方で、フィードバック、例えば記述試験のような主観的な評価に対してはどうなのかという疑問が個人的にはあります。みなさんは、もしそういった記述問題のような機械的な判断に対して、AIと人間の評価のどちらを信頼しますか？

人間の評価では、好みや偏見も多少入ると思うので公平性が保てていない可能性もある。AIの方がブレのない基準で正確に評価できるのでは…という考えでしょうか。

逆にAIは、評価基準に当てはまるものしか評価できない。人間の方が、例えば尖った意見に対しても見逃さずにちゃんと見てくれそうだから信用できるのでは…というような考えでしょうか。

そこで、今回はフィードバックに対して学生がAIをどう認識しているかを実験検証した最近の論文をご紹介します。
「Exploring undergraduate students' perceptions of AI vs. human scoring and feedback」（大学生のAIと人間の採点とフィードバックに対する認識調査）です。

AIと人間の評価を比較した実験

この研究は、カナダの大学生159名を対象に、人間の評価者による採点・フィードバックと、AIによるものを比較調査しました。
研究方法は以下の通りです。

調査手順

まず、AIによる採点に対する学生のAIによる評価全般に対して抱いている「先入観」や「期待値」を測定するため事前の認識を調査（ベースライン調査）。
次に、学生には「誰が評価したか」を伏せた状態で、３つのサンプル回答のうちの一つの回答とそれに対するAIの採点・フィードバックor人間の採点・フィードバックのどちらかを提示する。そしてその内容を学生に評価させる（ブラインド評価）。
最後に、誰が評価したか（AIか人間か）を明かした上で、学生の認識がどのように変化するかを調査。

補足すると、採点と評価の生成は、ChatGPT-4を使用したものです。
また、ベースライン調査について、結果を先に書いておくと、「学生たちは、AIの速さや客観性には期待しつつも、内容の深さや信頼性については不安を感じており、特に自分がテクノロジーにどれだけ親しんでいるかによって、その期待値が左右されている状態だった」となっています。
ただ、全体としては極端にポジティブでもなくネガティブにも偏っていなかったということでした。それを踏まえて、結果を見てみましょう

学生はAIと人間の採点を見分けられたのか

研究の主な結果は次の通りです。

AIと人間を見分けることの難しさ
多くの学生は AIと人間の採点を正確に見分けることができなかった。
（159人の学生に６つの採点・フィードバックパターンを見せたが、正解率は37〜59％）
人間による評価への信頼
・全体として、学生はAIよりも人間による採点やフィードバックを好む傾向があった。
・「誰が評価したか」を伏せていた際、AIによる評価を「人間が書いたものだ」と勘違いした学生は、それを好意的に評価する傾向があった。
正体が判明した後の認識の変化
・評価したのがAIであると明かされた後、学生のAIによる採点に対する自信や信頼感は有意に低下した。途端に評価が厳しくなるという現象も見られた
認識を左右する個人差
・学生がAIをどのように評価するかは、個人の特性によって大きく異なる。日頃からAIに慣れ親しんでいる学生ほど、AIによる評価を公平で正確だと感じる傾向があった。しかし、その限界もよく知っているため、正体が明かされた後には逆に懸念を強く抱くという複雑な反応も見られた。

まず、正確に見分けることができなかったということについて、最新のAIが生成する回答は、一見では人間と遜色ないほどの性能になっているということがわかります。

そして、もう一つの重要な結果だと思うのが、正解かどうかに関わらず、人間の評価だと思ったものを高く評価しているということです。心理的なバイアスがかかっているんですね。
調査結果から言えるのは、「AIの採点能力」よりも「誰が評価したと思うか」が信頼に影響するということなのではないでしょうか。つまり、人間の評価の方が納得できるということなのかもしれません。

AIによる採点が教育現場で使われるための条件

著者はこの結果の結論とそれに対する教育現場への示唆を次のように述べています

結論：
本研究は、AIによる自動採点が技術的に可能であっても、学生がそれを受け入れるまでにはまだ心理的な壁があることを浮き彫りにした。学生はAIの効率性を認めつつも、教育の根幹にある「人間同士のつながり」や「深い理解」を依然として重視している。

今後、AI技術がさらに進化し、よりパーソナライズされた（個人に最適化された）フィードバックが可能になれば、学生の認識も変わっていく可能性がある。AIを単なる人間の代わりとするのではなく、人間の教師をサポートし、学習体験を豊かにするツールとして、慎重かつ段階的に導入していくことが重要である。

教育現場への示唆：
・透明性の確保
学生に対して誰が評価を行っているのかを明確に伝える
・ AIと人間の「いいとこ取り」
AIは客観的で迅速な採点に優れているが、人間は学生一人ひとりに寄り添った温かみのある、深いフィードバックを得意とする。これらを組み合わせることで、より効果的な教育が可能になると考えられる。

なぜ人は「人間の評価」に納得するのか　

以上が論文の概要です。
人間の評価の方が納得するという結果は、逆に言うとまだ学生たちは人間の先生に評価をしてもらいたいということの表れではないかと思いました。個人的にはこの先、AIがもっと進化して、学生たちのAIへの知識が深まってきても変わらないことなのではないかと思います。

「誰が言ったか」が信頼に影響する現象は、人間が学習において“関係性”や“意図”を重視する生き物だからだと教育心理学では言われているようです。つまり、「AIが書いた」「先生が書いた」で受け取り方が変わるのは、人間は“この人は自分のために言ってくれているのか”を無意識に判断しているということでしょう。

また教育哲学では、「学習は単なる情報処理ではなく信頼できる相手から学ぶ行為」とされているようです。（例えばTrust Between Teacher and Student in Academic Education at Schoolなど参照ください）

この結果からは、AIがどれほど優れた採点を行えるようになったとしても、人間の先生は必要で、大きな役割があるということが一つ言えるのではないでしょうか。教育とは、情報ではなく、人と人との関係の中で生まれるものなのかもしれません。

◾️タイトル：Exploring undergraduate students' perceptions of AI vs. human scoring and feedback◾️著者：Mackenzie L. Thomas、Seyma N. Yildirim-Erbasli、Shruthi Hariharan◾️掲載誌：The Internet and Higher Education （Volume 68）◾️DOI：10.1016/j.iheduc.2025.101052◾️公開日：2026年1月

このコラムのまとめ

AIによる採点は広がりつつあるが、学生の信頼は必ずしも高いとは限らない。
実験では、多くの学生がAIと人間のフィードバックを正確に見分けることができなかった。
しかし学生は、人間が書いたと思った評価をより好意的に受け取る傾向があった。
AIによる評価だと分かると、同じ内容でも信頼度が下がるという心理的バイアスが見られた。
AIは効率的な採点を得意とする一方、人間の教師は深い理解や関係性を支える役割を持つ

文：鈴木素子

<< 前のページ

1分で読める発明塾 TOP

AIが採点する時代でも、学生は「先生の評価」を求める？　〜大学生159名の実験から見えたこと〜

AIの採点は信頼できる？

AIと人間の評価を比較した実験

学生はAIと人間の採点を見分けられたのか

AIによる採点が教育現場で使われるための条件

なぜ人は「人間の評価」に納得するのか

このコラムのまとめ

【その７】「子育てと教育」〜これからの時代に生き抜く力を〜記事一覧

5秒で登録完了！無料メール講座

AIが採点する時代でも、学生は「先生の評価」を求める？ 〜大学生159名の実験から見えたこと〜

AIの採点は信頼できる？

AIと人間の評価を比較した実験

学生はAIと人間の採点を見分けられたのか

AIによる採点が教育現場で使われるための条件

なぜ人は「人間の評価」に納得するのか

このコラムのまとめ

【その７】「子育てと教育」〜これからの時代に生き抜く力を〜 記事一覧

5秒で登録完了！無料メール講座

AIが採点する時代でも、学生は「先生の評価」を求める？　〜大学生159名の実験から見えたこと〜

なぜ人は「人間の評価」に納得するのか　

【その７】「子育てと教育」〜これからの時代に生き抜く力を〜記事一覧