ChatGPT4无法获得麻省理工学院学位
OpenAI的ChatGPT是一个很棒的工具,尽管在几个方面存在缺陷。利用大语言模型(LLM)的功能,同时保持其在周边视觉方面的局限性,是目前正确的方法。
最近,一篇论文声称ChatGPT-4在MIT的EECS课程中可以取得100分的成绩,引起了轰动。然而,随之而来的是一个不道德的数据来源和反复提示以获得期望结果的肮脏故事。让我们更深入地研究一下。
几天前,IddoDrori教授发表了一篇题为“使用大型语言模型探索MIT数学和EECS课程”的论文。该论文仔细审查了“包含4,550个问题和解决方案的综合数据集,这些问题和解决方案来自问题集、期中考试和期末考试,涉及获得学位所需的所有麻省理工学院数学、电气工程和计算机科学(EECS)课程。”该论文的结论令人震惊:
“我们的结果表明,GPT-3.5成功解决了整个MIT课程的三分之一,而GPT-4通过及时的工程设计,在排除基于图像的问题的测试集上实现了完美的解决率。”
鉴于这些令人震惊的说法,这篇论文在社交媒体上疯传,一天之内就获得了500多次转发。
随后,劳纳克·乔杜里(RaunakChowdhuri)和他的同事对该报纸的说法进行了审查。与论文的主张相反,乔杜里发现所使用的方法存在明显的问题:
该数据集包含10个无法解决的问题。这意味着ChatGPT-4正在按照提示提供解决方案,或者问题没有正确评分。经过更深入的检查,Chowdhuri发现ChatGPT确实通过所谓的“少数示例”在提示中泄露了解决方案,这些示例是作为附加上下文提供给模型的问题及其解决方案。
源代码中的拼写错误和错误会污染提示并导致与论文本身描述的结果不同的结果。
由于交换了参数,特别是当涉及到零样本函数时,模型会返回无法分级的混乱响应。
该论文声称ChatGPT的响应经过了手动双重验证。然而,Chowdhuri发现该程序正在使用“记录的正确答案来指导其行动”,即何时在零样本学习和少样本学习之间切换。
此外,多位麻省理工学院教授随后发表声明,披露该论文未经授权来源于麻省理工学院数据集:
“6月15日,IddoDrori在arXiv上发布了一篇与麻省理工学院数十门课程的考试和作业数据集相关的工作论文。他在没有得到许多合著者同意的情况下这样做了,尽管他被告知在出版前应该纠正一些问题。”
免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!
- TUMI途明中国首家旗舰店耀世启幕,以卓越风范开启品牌发展新篇章
- TUMI途明中国首家旗舰店于上海璀璨启幕
- 新款AnkerSOLIXC200DC泄漏揭示了即将推出的太阳能移动电源的所有可能规格
- ViXion在Greenfunding和Kibidango上发起ViXion01S自动对焦眼镜众筹活动
- Minisforum790S7迷你电脑配备AMDRyzen97940HX和RTX4060dGPU现已打折
- 谷歌刚刚发布了Pixel智能手机今年最大的更新
- 卡西欧将为查尔斯达尔文基金会系列推出加拉帕戈斯主题GSHOCKGA-B2100CD手表
- 努比亚Z70Ultra尖端摄像头面板下显示技术在最新泄露中亮相
-
【蠢货歌词是什么】“蠢货歌词是什么”是许多网友在搜索歌曲歌词时常用的一个关键词,尤其是一些带有情绪化或...浏览全文>>
-
【蠢蠢欲动什么意思】“蠢蠢欲动”是一个常见的汉语成语,常用于描述某种不安分、准备行动的状态。它通常带有...浏览全文>>
-
【生日祝福语文案情侣】在情侣之间,生日不仅是纪念日,更是表达爱意与情感的重要时刻。一句贴心的生日祝福语...浏览全文>>
-
【生日祝福的四字成语有哪些】在生日这一天,送上一句恰到好处的祝福语,不仅能表达心意,还能让对方感受到温...浏览全文>>
-
【生日祝词怎么说】在日常生活中,生日是一个充满温馨与祝福的时刻。无论是为朋友、家人还是同事送上生日祝福...浏览全文>>
-
【生日支付宝有什么福利】支付宝作为国内领先的第三方支付平台,不仅在日常生活中提供了便捷的支付服务,还在...浏览全文>>
-
【生日怎么区分阴历阳历】在日常生活中,我们经常会遇到“生日”这个话题,但很多人并不清楚自己或他人的生日...浏览全文>>
-
【生日怎么过好玩跟朋友】生日是每个人都期待的日子,尤其是和朋友一起庆祝的时候。如何让生日既有趣又难忘?...浏览全文>>
-
【生气英文是什么】在日常交流中,我们经常会遇到需要表达“生气”这个情绪的场景。无论是与朋友聊天、写作文...浏览全文>>
-
【生气地看应该用哪个词语表示】在日常生活中,当我们想表达“生气地看”这种情绪时,常常会遇到选择合适词语...浏览全文>>