谷歌Gemini被捧上天实测却翻车,连GPT-3.5都不如?

admin AI新闻 19

经过一夜, 在被宣称具有能碾压GPT - 4能力的多模态全新模型Gemini的带动之下, 谷歌的股价于隔夜之际出现了幅度达5%的大幅上涨。起码谷歌自身对于Gemini所具备的能力持有相当充足的信心有着极强深度, 谷歌在纷繁多样各种各样的宣传文案当中, 将Gemini夸赞到了极高夸张的程度, 投放出来拿出来展示的用以演示介绍的视频效果呈现出极其相当非常地惊艳之感。

当前, Gemini的“精简版本”Gemini Pro已落地谷歌的AI聊天机器人Bard(仅英文版)。然而, 依据测试过的用户在X上给出的反馈来看, 其效果好像并非那么尽如人意, 在基础事实、数学题目、生成新闻摘要等方面的表现称得上差劲, 甚至比不上已经推出了一年多的GPT-3.5。

比如说, 有一位用户朝着Gemini进行询问, 询问的内容是, 到底谁才是2023年的奥斯卡最佳男主角, 然而得到的却是布兰登·格里森(Brendan Gleeson)这样一个错误的答案, 并非是真正的获奖者布兰登·弗雷泽(Brendan Fraser)。

谷歌Gemini被捧上天实测却翻车,连GPT-3.5都不如?-第1张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

明明是完全有着能够访问互联网的那种能力的, Gemini却连奥斯卡得主这样一个只要随手去谷歌一下便能够知道的基本事实都出现了错误, 这实在是让人觉得耐人寻味。

更离谱的情况是, 有一位Techcrunch记者, 向Gemini提出这样一个同样的问题的时候, 它给出的答案却是不一样的, 而且还是错误的答案, 这个答案是奥斯汀·巴特勒(Austin Butler)。

谷歌Gemini被捧上天实测却翻车,连GPT-3.5都不如?-第2张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

再者, 如同上面所展示的那样, Gemini在别的奖项方面也呈现出胡乱编造的情状呢。

获取第95届奥斯卡最佳纪录片奖的影片是《纳瓦尔尼》, 并非《所有的美丽与血泪》, 得到最佳国际影片奖的是《西线无战事》, 然而Gemini给出的答案同样是《所有的美丽与血泪》……

此外, 科幻小说作家Charlie Stross, 在最近发布的一篇博文中, 发现了更多的谬误, Gemini还会编造其他信息, 比如说声称Stross本人为开发Linux内核做出了贡献, 然而实际上他从未参与过和Linux内核有关的项目。

记者是Techcrunch的, 他再度向Gemini提出要求, 要说出一个具备6个字母的法语单词, 然而Gemini给出的回应所含字母却是7个。

谷歌Gemini被捧上天实测却翻车,连GPT-3.5都不如?-第3张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

然而, 必须要明确指出的是, 华尔街见闻先前的文章曾经着重强调过的是, 包括控制字符数量在内的相关场景一直以来都是是人工智能的短处所在这一点, 而之所以会出现这样的情况是因为生成人工智能其所依托的技术逻辑即为依据上下文间去实现预测得到的同时还提到是以为数据存储单元而并非字符为基础的存在。

下达同样任务给GPT的是华尔街见闻, 给出包含7个字母错误答案的是后者的GPT。

谷歌Gemini被捧上天实测却翻车,连GPT-3.5都不如?-第4张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

在对新闻进行总结这块, Gemini展现出来的表现开云真人app在线登录世界杯直播观看,看上去那种谨慎的程度好似有些过度了, 而这种过度状况已经达到了影响到基本的使用体验的地步。

像下面所呈现的这样, 有一位X用户, 其只是单纯地请求它把巴勒斯坦与以色列冲突的最新状况列举出来, 并没有去要求Gemini给出一种评判, 然而Gemini却向用户讲道:

要不你自己上谷歌搜一下吧。

谷歌Gemini被捧上天实测却翻车,连GPT-3.5都不如?-第5张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

华尔街见闻对同样的问题进行了尝试, 结果也得到了相同的建议, 那就是: 自己去搜吧!

谷歌Gemini被捧上天实测却翻车,连GPT-3.5都不如?-第6张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

相比之下,GPT则给出了一个附有引文的列表式新闻摘要:

谷歌Gemini被捧上天实测却翻车,连GPT-3.5都不如?-第7张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

然而, 有意思的是, 在记者向Gemini问起俄乌冲突的最新情况之时, Gemini并未选择规避, 而是产出了一份新闻摘要。可是, 这些信息已整整过时一个多月了。

谷歌Gemini被捧上天实测却翻车,连GPT-3.5都不如?-第8张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

那么, 写代码的能力究竟如何? 它可是AI针对人类生产力实现提升的、极为关键的应用领域当中至关重要的一个领域。

然而, X用户所给出的反馈显示出, 尽管Gemini在编写代码这一方面相较于之前版本的Bard是存在进步的, 可Gemini的基础代码能力是颇为普通的, 甚至还比不上比它早上许多的GPT。

又有一位X用户, 对用AI去生成一个小游戏的代码进行测试, 其结果是, GPT在初次尝试时, 便把代码给写出来了, 然而Gemini呢, 却需要三次才能完成。

总结一下开云手机入口app下载开云app官方入口网站,网友测试的反馈大概就是——不如GPT。

当然, 当前能够着手去上手运用来使用的Gemini Pro并非是那个Gemini性能最为强劲的版本, 性能最强的Gemini Ultra势必要等到明年的某个特定时候才会于谷歌Bard还有其他产品当中进行推出, 谷歌Gemini Pro所对标的乃是比它早一代的GPT—3.5。

很明显, Gemini Pro仍存在着相当大的可以取得更大进展的范围。那么, 最为强大的Ultra是否如同谷歌所展示的那般具有超乎寻常的神奇之态? 这得一直等到明年才能够知晓结果了。

标签: AI测试 谷歌Gemini GPT-3.5 性能比较 技术评测

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~