在此之前,马兰那种精力充沛、引人入胜的教学风格被认为是把枯燥的入门级网络开发和软件编程基础知识讲座,变成了一个充满互动练习的娱乐课程。但是现在,他说即使有100多名人类助教,也很难与越来越多来自不同时区、知识和经验水平各异的学生充分互动。
46岁的马兰在接受电话采访时说:“在线学生比教师多得多,大规模为学生的具体问题提供量身定制的支持是一项挑战。”
如今,他的团队目前正在对一个AI系统进行微调以标记学生的作业,并对一个虚拟助教展开测试,以评估学生的编程并提供反馈。他说,虚拟助教会问一些反问句,并提供建议来帮助学生学习,而不是简单地发现错误和修改代码错误。从长远来看,他预计这将给人类助教更多的时间进行面对面辅导或者在会议平台Zoom上办公。
马兰表示,CS50对AI的使用凸显AI对教育的好处,特别是在提高在线学习的质量和获取方面。美国市场研究公司Grand View Research预计,到2030年时,在线学习行业规模将增长到3480亿美元,比2022年增长近两倍。“AI可能会极大地促进教育。”马兰称。
头疼的AI作弊检测
事实证明,人类无法可靠地检测像ChatGPT这样的AI的写作。这是一个大问题,尤其是对教师来说。
更糟糕的是,科学家们越来越多地表示,使用软件准确识别AI或许根本不可能。
这里有一个最新证据。大型教育软件公司Turnitin表示,自今年4月以来,该公司使用AI作弊检测器检查了3800多万篇学生论文。结果,AI作弊检测器的可靠性问题比最初显示出来的要严重。Turnitin之前为每个学生的论文分配了一个“AI生成”的百分比分数,目前正在做一些调整,包括对最容易出错的临界结果类型添加新的警告。4%,甚至1%的AI作弊检测错误率可能听起来很小,但每一个错误的作弊指控都可能对学生造成灾难性的后果。一些学生和家长称,他们对遭到的错误指控感到痛苦不堪。
Turnitin首席产品官安妮·彻奇泰利(Annie Chechitelli)上周在一篇长篇博客文章中表示,公司希望对其技术保持透明,但她并没有放弃部署该技术。她说,对于其检测软件认为包含超过20%AI写作的文档,整个文档的误报率不到1%。但她没有具体说明其余情况下的错误率是多少,也就是其检测软件认为包含少于20% AI写作的文档。对于检测软件认为AI写作比重低于20%的论文,Turnitin已经开始在结果旁边加上星号,“提醒人们注意分数不太可靠的事实”。
“鉴于AI写作和分析的性质,我们无法完全降低误报的风险。因此,在这种情况下,教育工作者利用AI评分与学生展开有意义和有影响力的对话是很重要的。”彻奇泰利表示。凤凰网科技《AI前哨》对此将持续关注。