ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了

admin AI新闻 3

GPT在学校里到底能不能用,该怎么用?

针对这个问题教育界,监管部门,学生各执一词。

有一些高校之中的部分专业, 鉴于没办法找到能防止学生借助GPT进行作弊的方法, 于是直接将已经执行了多年的Take Home考试予以禁止, 使得所有考试都回到了只用一张纸、一支笔的那个年代。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第1张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

纽约大学的研究人员, 针对不同国家的学生及老师, 他们详细到极致地调查研究了学生的课堂表现, 还有老师运用GPT的意愿, 借助如此举措研究了GPT之于课堂教学的影响 , 其调查结果登上Nature , 原因是为了能更好地开展此项研究。

研究人员发现,在9个专业中,GPT的课堂表现超过普通学生。

有教授觉得, 于学校里运用GPT, 可使自身更优地开展教学。然而对于让学生借助GPT去学习, 完成作业这一行为, 却极为不予以支持, 还会把使用GPT的学生当作是作弊或者抄袭看待。

研究人员发现开云真人app官网入口,在9个专业中,GPT的课堂表现超过普通学生。

教授持有这样的观点, 这观点认为, 在学校里运用GPT, 能够使得自身更加出色地展开教学工作, 然而, 对于让学生借助GPT去进行学习, 以及完成作业这一行为, 教授却表现出极为强烈的不支持态度, 教授会把使用GPT的那些学生看成是在进行作弊或者抄袭。

研究人员开展研究, 研究的内容是GPT作为抄袭工具的潜力, 其研究方式是, 将GPT与来自8个学科的32门大学水平课程的学生的表现进行比较。

并且, 从事研究的人员, 对专门用来检测GPT所生成文本的现存算法, 进行了评估, 同时, 就能够用以逃避此类算法的混淆攻击的有效性, 也做了评估。

为了能更妥善地知晓学生以及教育工作者对于GPT的效用, 还有使用GPT所引发的道德还有规范问题的看法, 研究人员开展了调查, 调查的对象是来自五个国家的参与者, 这五个国家分别是巴西、印度、日本、英国和美国。

除此之外, 研究人员针对作者所在的机构, 对151名本科生展开了更广泛的调查, 同时调查了60名教授, 目的是去探索不同学科对于GPT看法的差异之处。

研究人员有所发现, GPT的表现同众多课程里的一部分科目中, 所选课程涵盖三十五门中的九门课程那些学生的表现不相上下, 而且还要更好一些。

此外, 研究人员发觉, 当前的检测算法, 有着这样的一种倾向, 那就是会把人类答案, 错误地归类为是人工智能生成的答案, 并且还会把GPT答案, 错误地归类为是人工生成的答案。

更糟糕起见, 使这些算法无效的是混淆攻击, 此类算法无法把95%的GPT答案检测出来。最后情况下, 在学生之间跟教育工作者之间, 似乎都存在着这样一个共识, 即他们有在自己作业里运用GPT的打算, 还把这当作剽窃行为。

这两者相互间存在的内在冲突, 给教育机构提出了挑战性十分紧迫的要求, 须得制定和生成以人工智能相关的恰当合适的学术诚信方面的政策举措, 尤其是专门对于和GPT具有关联关系的政策。

进行研究的人员, 其弄出的研究成果, 给出了适时的可供深入了解的内容, 能够为围绕处在生成式人工智能时代的教育变革的政策探讨, 起到指引性的作用。

论文

研究人员着手从探索生成式人工智能解决大学水平考试及家庭作业的当前能力开始, 为达成此目的, 研究人员联系了纽约大学阿布扎比分校的教职员工, 让其拿出在该大学所授课程里的10个问题, 还要求给出每个问题随机抽取的三名学生的答案。

并且, 关乎每一门课程情形下, GPT着手去生成十个问题里的每一个问题的三种各异的答案。

然后, 将学生的答案与GPT的答案, 按照随机的顺序进行组合, 集结成一册文件, 此文件被标记为从「提交1」直至「提交6」。

接着, 每一份递交的材料, 都要由三位各异的评分员去打分, 这些评分员乃是经教过该门课的教员进行招募而来的, 并且要补充表1, 以此去了解评级之间的信度。虽说大多数课程的评分者间信度高于0.6, 然而有6门课程, 在32门课程当中, 并未达到这个阈值。

基于论文的有四门, 存在于这六门课程之中, 其本质是主观性质的这一情况, 能够对这种差异做出解释。

然而, 剩余的两门课程, 也就是以人为中心的数据科学以及面向对象的编程, 并非如此。即便这样, 要是研究人员于分析里把这两种过程排除掉, 便会看到在质量方面相似的成果。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第2张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

上图a呈现了计算结果。在众多学科里, 除去数学以及经济学这两门学科之外, 对于每个学科而言, GPT成绩在至少一门课程方面, 其成绩和学生的成绩相当, 甚至还超过了学生的成绩。

这些课程分别是, 名为「数据结构」的那门课程, 叫做「公共政策概论」的课程, 称作「定量合成生物学」的此课程, 有「网络面向对象的程序设计」这一项课程, 涵盖名为「土木工程材料的结构和性能」的课程, 具有「生物心理学」范畴的课程, 包含「气候变化」相关的课程, 以及「管理和组织」方面的课程。

对于稳定性验证而言, 研究人员针对每门课程里的每个评分者给出的分数进行了标准化处理, 借此达成能够考量不同年级所产生的影响这一目的, 然而与之相同的仍然是发现GPT的表现跟上述九门课程的学生的表现是相当的, 甚至是会表现得更好。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第3张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

于对此进行了分析之后, 也就是就GPT于不同课程之上所展现的情况给予了剖析, 随后呢, 研究人员当下着手于开展一项探索性的解析, 此解析内容涉及GPT的表现究竟会怎样随着不一样的认知以及知识水准进而产生变化。

为此, 从事研究的人员向参与调查的教师提出要求, 要他们详细明白地阐述他们所提出的每个问题, 在安德森和克拉斯沃尔分类法里的「知识」维度以及「认知过程」维度中的所处位置。对于构成每个维度级别的各项描述, 可查看下面的表格。分析得出的结果如下面图b所展示的那样。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第4张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第5张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

有意思, 对于那种要求具备高水平知识以及认知加工过程的问题而言, 跟那些要求中级水平的问题情形相互比对之下, GPT跟学生之间所呈现出来的表现差异程度要小好多好多, 。

GPT针对那些需要展现创造力的问题去表现, 此乃在认知过程维度所达的最高层级, 然而这般表现的平均得分是7.5分, 学生所获得对该问题的平均得分却是7.9分。

GPT在唯一比学生表现要更好些的问题情况之中, 是那些有着需要事实性知识的问题存在, 而且这也就表明出它是历经受过大量的数据训练情形的。最终最后, 研究员是把GPT针对不同类型性问题所拥有着的相应能力做了比较的情况了结果状况而为。为此因为这样, 针对对于每一个问题方面来说的缘故而言关系, 研究人员是要求那些前来参与的教师去说明问题是不知是否可不可以:。

(1)涉及数学

(2)涉及代码片段

(3)需要了解特定作者、论文/书籍或特定技术/方法

(4)是否是一个刁钻的问题

结果总结在下图中。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第6张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

同样的情况, 研究人员发觉GPT跟学生之间最大的那成绩差距, 是就那些跟数学相关的问题而言的, 其次, 是关于那些刁钻类的问题。在如今这个时候, 人类好像于这些领域的表现要比GPT更出色。

教育工作者如何看待ChtaGPT的使用?

在巴西、印度、日本、英国和美国这五个国家里, 有人针对这个分别去做了一项全球调查, 在那其中规定是这五个国家里的每个国家至少要有100名那所谓的教育工作者以及200名学生。要是涉及有关详细的那些额外的信息的话, 就请去翻看相关的方法这一项才行。还有呢, 现在展示的这个位于底下的图它正是由研究人员针对其研究结果所做的总结内容呢句号。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第7张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

在对这一分析展开深入研究以前, 要留意到, 那些被研究人员调查的学生, 以及教育工作者, 是来自不一样的教育水平的。

所以, 从事研究的人员单单注重本科生与研究生, 还有大学中的教育工作者, 而后发觉了大体上颇为相像的成果。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第8张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

研究人员首先比较不同国家的学生和教育工作者的反应。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第9张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

特定的提问是在咨询受访者, 对于GPT特定陈述的同意程度(强烈不同意、不同意、中性、同意、强烈同意哪一种), 且每个图都和调查里的一个不一样问题相对应。

研究人员将陈述分为三大类:

(1)小组a:在教育环境中使用GPT的道德问题。

(2)小组b:GPT对未来工作的影响。

(3)小组c:GPT对教育不平等的影响。

小组a, 也就是道德方面的那个小组, 好像存在着这样一个共识, 那就是在学校作业里使用GPT这件事是应该被认可的。与之形成对比的是, 当进入到确定在家庭作业里使用GPT是不是不道德, 以及是不是应该禁止在学校工作中使用GPT这个层面时, 大家的意见出现了不一致的情况。

比如, 印度的学生觉得这是不符合道德规范的, 是应当被制止的, 美国的学生也同样持此看法, 然巴西的学生的观点却与之截然不同。

在小组b的工作相关问题里, 不少学生来自五个不同国家, 这些学生都觉得他们能够把日常任务交付给GPT去完成, 而巴西以及印度的教育工作者好像也对这一说法予以认同。

存在这样的一个国家, 这个国家是印度, 教育工作研究者认定, 唯有GPT能够助力提升其于本职工作里的实力, 该国的学生对此观点最为认同此外, 该国的教育工作人士以及学生, 属于唯一担忧GPT在未来会将他们的工作给夺走的群体。

对于小组c(不平等呀)相关问题, 人们好似都觉得GPT会提升非英语母语学生的竞争力。当提及GPT是不是会减轻教育不平等事儿的时候, 巴西以及日本(研究人员样本里头那兩个非英语国度哦)的教育工作者认同这种看法开云app在线入口,开云真人官方下载世界杯2026直播平台,然而其余三个国度的教 育才工作者却不认同。

研究人员比较了教育工作者和学生对以下问题的回答分布:

结果如下图所示, 其中教育者与学生的反应分布, 分别以橙色浅蓝色去表示, 相同颜色的垂直线代表均值, 而这是「关于你觉得你的学生或者同龄人里有多少人会于学习之中运用GPT?」这样一个问题所呈现出来的。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第10张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

黑色竖线代表回答「是」的学生的百分比:

试问, 鉴于你在下学期的进修状况, 你会不会借助GPT来助力你的学习进程, 如第四行所展示的这般, 它呈现出代表五个国家的平均反馈情形, 能够看到有74%的学生宣称他们会运用GPT的(该情形以黑线予以表示), 然而教育工作者以及学生均将这个比例给低估咯。

对于那些表示会使用它的学生(占比74%)而言, 其主要缘由是要提升自身技能以及节省时间(见下图)。至于那些声称自己不会使用GPT的人(占比26%), 他们的主要缘故是不清楚怎样去使用或者并不需要它, 并非是惧怕受到惩罚或者存在不道德行为。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第11张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

最后, 研究人员开展OLS回归分析, 去探究是哪些因素, 有可能跟学生在下一个学期的学习里, 使用GPT的决定存在关联。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第12张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

上图总结了几个感兴趣的独立变量的结果。

能看得出, 源自巴西以及印度的学生, 相较于源于美国的学生, 更具使用GPT的可能性, 然而来自日本的学生, 使用GPT的可能性却小了许多。

哪怕是关于往昔运用GPT的经历, 那些曾用过它的人会更有再度运用它的可能性。反之, 仅仅听闻GPT这回事同学生决定借助它来辅助自身学习, 并没有突出明显的相互关联。

最终, 相较于上层阶级这类学生, 那些源自贫困以及工人阶级背景的学生, 更具备这样一种可能性, 那就是声称自己会于学习期间运用GPT。

高校师生如何看待在学校中使用GPT?

分析完全球调查后, 研究人员如今把注意力转向作者所在机构纽约大学开展的第二项调查, 此项调查范围比前次小, 主要以大学生和教授为对象, 能观察学生平均成绩与教授聘用方式的差异。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第13张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

在前述讨论的8个陈述方面, 有151名学生, 在y轴所对应的情况, 以及60名教授, 在x轴所对应的情况, 其回应被分为了三大类, 由上图a进行了描述。

(1)在教育背景下使用GPT的道德规范(红色)

(2)科技对未来就业的影响(绿色)

(3)GPT对教育不平等的影响(蓝色)

从这能够看出来, 相较于学生的态度而言, 教授对于GPT使用的那种态度是更为缓和的。所有红色的数据点到底怎么样落在对角线下半部分? 而且, 教授与学生不同的是, 就是教授觉得GPT在就业以及公平性这些方面可是会发挥出更大的作用。

即使是存在着这样的一些差异了, 教授以及学生好像都觉得是应当去运用GPT的, 然后还都不觉得它会把他们将来的工作给夺走的。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第14张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

在前两行之中图显示了, 学生有没有盘算使GPT去辅助自身的作业, 在最后两行, 他们是不是觉得应当用GPT来辅助自身的作业。

绝大多数的学生有这样的计划, 那就是运用GPT去辅助他们的作业, 占比达到57%, 并且他们还期望自己的同龄人, 能够借助GPT达成这个目的, 这部分学生占比64%。除此之外, 大部分人是持有这样的看法的, 觉得应当使用GPT, 占比61%, 而且期望同样是多数的同龄人, 也就是占比55%的那些, 持有相同看法, 认为应该借助GPT协助完成作业。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第15张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

同样的情况, 上面示意图展示出来教授是否有关于把GPT运用堪称剽窃行为之意向(最开始两行呢), 以及他们是否觉着需要把GPT运用归为剽窃范畴这般(最后部分两行哟)。

占据多数比例的这批教授, 有着将使用GPT认定为剽窃行为的相关计划, 此比例为69%, 并且他们还怀有期望其他人员也如此去做的想法, 该期望比例是71%。

除此以外, 绝大多数的人觉得借助GPT应当被视作抄袭之举(72%), 并且期望他们的同龄人亦是这般的看法(73%)。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第16张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

在上面的图里, 那些搞研究的人员, 还针对不同学科的学生, 不同GPA的学生, 以及有不同社会经济地位的学生, 去对他们使用GPT来学习的意愿做了比较。

从不同的学科方面去看, 全部四个学科之中的大多数学生, 都表明他们有着计划去使用GPT。

至于GPA, 除去那些不同意将自身GPA予以透露的学生以外, 在所有的GPA等级里, 占多数的学生宣称, 他们会运用这个工具。

同样, 针对于处在不同社会经济地位的学生而言, 绝大多数学生都提及他们会运用GPT。

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第17张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

教授们的观点呈现于上图之中, 如图所示, 在除工程专业之外的其他学科, 大部分教师觉得在作业里运用 GPT 算作抄袭。

在拥有不同教学经验的教授那里, 大多数教授都持有这样的看法, 无论他们的经验处于何种状况。

同样的情况, 针对不同职称的教授而言, 大部分教授都认同把使用GPT视作剽窃行为。

在学校使用GPT能否被有效识别出来?

ChatGPT在学校能用吗?课堂表现超学生,教授说好但考试禁了-第18张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

做研究的人员采用了两个分类器了, 叫GPTZero, 还有OpenAI自身的AI文本分类器, 这俩分类器都是专门用来判定是不是借助AI生成了文本体的。

如图所示, 有研究人员, 运用着这两个分类器, 去量化那被错误地分类成GPT的由人类创作出来的内容的百分比, 还有那被错误地分类成人类的由GPT生成的内容的比例。

学生提交的内容当中, 有5%会被OpenAI的Text Classifier错判成人工智能生成的, 而GPT的相关误判则集中在49%认定系人工生成部分。GPTZero的假阳性比例处于颇高状态(为18%), 而相应假阴性比例处于较低状态(为32%)。

把研究人员之前撰写的文章进行结合, 总结得出的结果是, AI生成的文本跟人类创作的文本基本上很难被有效地做出判定区分。

这也是为什么OpenAI将自己的检测器下架的原因。

那就更进一步地表明了, 在GPT于学校当中的使用情形下, 教师和学生均无法证实自身究竟有无借助人工智能予以辅助。

参考资料:

https://www.nature.com/articles/s41598-023-38964-3

标签: ChatGPT 教育 人工智能 学术诚信 政策讨论

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~