跳转到主要内容
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 标志
  • 全部文章
  • 🗒️ 注册
  • 🔑 登录
    • 日本語
    • English
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 隐私政策 cookie_banner_and Cookie政策 cookie_banner_more_info

Cookie设置

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

AI是否能提高“学习的性价比”?“在相同的分数下,减少负担”——在允许使用AI的课堂上看到的学习效率提升

AI是否能提高“学习的性价比”?“在相同的分数下,减少负担”——在允许使用AI的课堂上看到的学习效率提升

2025年10月30日 01:22

美国马萨诸塞大学阿默斯特分校(UMass Amherst)公布了一项学期纵向实验,比较了在相同课程大纲和相同考试条件下“允许使用AI的班级”和“禁止使用AI的班级”。结论具有挑衅性——考试成绩和最终成绩没有显著差异。但同时,课堂参与、自我效能感、满意度和学习效率在允许使用AI的班级中持续提高。研究以预印本(SSRN)的形式公开,大学的新闻稿和Phys.org进行了报道。SSRNumass.edu



研究要点:比较了什么,如何比较

  • 对象是高级反垄断经济学的连续两节课(包括下午)。讲座、作业和评分相同,一方(n=29)结构化地允许使用生成AI(明确使用指南和披露要求),另一方(n=28)禁止使用AI。考试为纸笔考试,不允许使用笔记或AI。作为保守设计,将AI许可分配给历史上成绩稍差的下午班。Phys.org

  • 结果:监考考试的分数和最终成绩没有检测到显著差异。另一方面,课堂参与、学习信心、效率感和满意度在允许使用AI的班级中较高。此外,AI相关职业倾向上升,以及编辑AI输出、错误检测、优先选择自己的答案等元认知行为的增长也被观察到。SSRN

  • 教师方面的启示是,**“如果允许使用,则需提供‘支架(scaffolding)’和披露规则”**这一信息被强调。umass.edu

  • 局限性:样本量小,包含自我报告指标这一点研究者自己也提醒注意。Phys.org


“分数没有提高但满意度提高”意味着什么

AI改变的不是“学习量”而是“学习的触感”——此次发现可以这样解读。学生在15到30分钟的集中学习中利用AI,通过验证和编辑输出来偏好自己的答案。这是AI作为“思维伙伴(copilot)”而非“答案制造机”时容易出现的态度转变。SSRN


评估以纸质测试为中心也很重要。在将评估重心转回人工和面对面的同时,承认学习过程中AI的应用这一设计理念在工程师社区中也得到广泛支持。Hacker News



与其他研究和最近案例的一致性

  • 在评分领域,GPT-4在描述性答案的相对排名中表现出与人类评分者相当的性能。AI作为“评估辅助”的适用性正在扩大。Phys.org

  • 另一方面AI评分的操作风险也是现实的。在马萨诸塞州的州标准测试(MCAS)中,约1,400篇作文因AI评分的技术故障被误判,随后进行了重新评分。人类的监督和设计的成熟是不可或缺的。Boston.com

  • 围绕大学中的AI作弊应对的不信任和误检问题自去年以来已成为英国报纸和社区中的一个重要议题。检测器的不确定性、误判导致的学生受害、评估方法的重新审视的必要性持续被讨论。卫报


社交媒体反应(初步观察)

由于公开时间较短,个别帖子数量有限,但在相关新闻和现有讨论线程中,以下论点再次引发关注。

  • “学习中可以使用,评估以面对面为中心”——此次设计被视为“现实解决方案”。课程设计的重心应放在考试和口试的现场这一主张上。Hacker News

  • “AI评分便利但危险”——以MCAS的误判事例为例,AI引入需以“人类双重化”为前提的谨慎论。Boston.com

  • “学生体验的改善不可忽视”——波士顿的本地报道强调**“同样的得分,课堂体验更好”这一点。“以更少的努力获得同样的成果(the same for less)”**这一结论句正在传播。CBS新闻

  • “AI作弊和误检的担忧”——对AI检测器的可靠性表示怀疑,被迫“证明清白”的学生的声音。要求刷新评估设计。卫报

※本稿的社交媒体观察基于主题接近的公开帖子和现有大型线程的“初步趋势”总结,非以个别引用回复的全面覆盖为主要目的。



对实践的启示:“如果允许就要设计”

UMass的研究者建议“允许+支架(scaffolding)+披露”三点组合。明确课程中AI的角色、适用范围、步骤和披露形式,通过纸质考试、口头考试、实演等不易受AI影响的评估来测量学习成就。**“通过AI学习,无AI证明”**的双层设计是关键。umass.edu


具体措施(检查清单)

  1. 在课程大纲中明确AI政策(允许任务/禁止任务/披露模板)。

  2. 提示和附加理由的提供(向AI指示了什么、为何、如何指示)。

  3. 提交编辑日志/自我评价(验证、修改、审查输出的痕迹)。

  4. 评估以课堂为中心(纸质考试、口头问答、白板编码、迷你演示)。这在社区中也有很强的支持。Hacker News

  5. 在评分中使用AI时进行“双重评估”(AI+人)。反映MCAS事件的教训。Boston.com


在日本的背景下

文部科学省计划在2024年10月至2025年3月期间推进面向教师的生成AI培训,并整备课程设计、教材制作、评估支持的知识。如果允许就要设计这一启示与日本的培训和指导方针整备方向性相契合。文部科学省



什么“尚未”明了

  • 普遍化可能性:在本科高级、经济学、同一教师控制下获得的结果是否可以扩展到其他学科领域、年级、大规模班级尚未验证。

  • 学期以上的纵向效果:基础知识的巩固、##HTML_TAG_492

← 返回文章列表

联系我们 |  服务条款 |  隐私政策 |  Cookie政策 |  Cookie设置

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.