一夜之间突然爆红的, 是科技领域巨头谷歌推出的新大模型Gemini, 它深受市场的看好, 然而, 却有专业分析特别指出, 在Gemini的宣传资料当中, 谷歌具有存在夸大宣传情况的嫌疑。
当地时间12月6日, 谷歌宣称推出新的大型语言模型Gemini, 其号称是“最大、最强、最通用”的。Gemini会是首个能直接在手机上运行的大模型, 它被应用在谷歌Pixel 8 Pro智能手机以及聊天机器人Bard上。Gemini被看作是对AI(人工智能)领域新锐巨头OpenAI旗下最新大模型GPT - 4的直接回应, 这也意味着一度因聊天机器人GPT而处于被动局面的谷歌终于正式重返赛道。
按照谷歌所讲, Gemini在MMLU(大规模多任务语言理解)里得分率抵达90.0%, 它是首个于MMLU测试中超越人类专家的模型, Gemini将会包含一套有着三种不同规模的模型, 当中, Gemini Ultra被设定为GPT - 4的竞争对手;Gemini Pro的性能比GPT - 3.5更优;Gemini Nano则被用于特定任务以及移动设备。
借助强大性能, Gemini一下子就红透了, 吸引到了华尔街的留意。12月7日, 谷歌母公司Alphabet(Nasdaq: GOOG)的股价上涨了5.31%, 收盘为136.93美元, 迎来了自今年8月29日以来行情最佳的一日, 总市值达到了1.72万亿美元。
6日, 美国银行的分析师指出, 因人们对谷歌的AI能力心怀担忧, Alphabet今年面临了一定压力, 一款“具备良好品牌形象且竞争力较强的模型”, 或许会吸引更多消费者运用谷歌搜索, 还会对云服务销售产生积极作用: “数据表明谷歌拥有一流且不可复制的AI能力, 这有可能对公司在2024年上半年的股票走势产生积极影响。”。
摩根大通的分析师, 在6日的一份报告里写道, 当天市场对Gemini没有给出明显反应, 不过, 能够看到谷歌在“这一主要技术转变”中的进展, 还是十分“鼓舞人心”的。然而, 摩根大通也指出, 大模型在“搜索领域的货币化路径存在不确定性”, 这可能会在未来带来一些阻力。
7日的报告里, 摩根大通的分析师写了这样一句, Gemini的推出象征着, 在已获得广泛商业化以及已然广泛传播的生成式 AI 的第二年当中, 谷歌做出了重大创新, 尽管当下还处在其发展的早期阶段。
以当前情形来看, 谷歌于整个业务范畴内, 特别是其中最为重要的搜索业务领域, 怎样去把Gemini予以商业化, 这是极为受华尔街所关注的一个要点。当下, 谷歌打算在本月较晚的时候借助谷歌云把Gemini许可给客户, 而且会在接下来的几个月时间里与谷歌服务之下的其他产品进行整合, 倘若还没有公开后续的那些商业化策略。
富国银行, 也就是Wells Fargo的分析师提及, Gemini的推出, 应当是足够能让关于“谷歌在AI领域究竟该去往何方才正确”的争论趋于平静的, 然而, 关键的问题在于, 谷歌要怎么凭借Gemini来得到赢利, “简单来讲, 我觉得谷歌证实了他们依旧存有一些竞争力。”。
且KeyBanc的分析师有言表明, Gemini可为谷歌今年一系列AI公告里的“顶点”, 然而要使AI给谷歌业绩增长以及盈利能力带来积极作用尚需时日, 其称: “Gemini依旧在不懈努力切入搜索等核心产品领域, 所以我们提议耐心观察其效果影响。”。
有别于华尔街呈现出的整体看好态势, 于科技范畴之内, 存在着这样一种声音表达出来, Gemini有可能存有被质疑为“夸大宣传”的情况。
Gemini在6日推出后没过多久, 就有网友指出了宣传资料里的一些不合适之处。比如说, 谷歌宣称Gemini的MMLU得分率比GPT-4高, 显示的GPT-4得分率是86.4%, 然而依据谷歌发布的60页技术报告, Gemini Ultra的MMLU测试结果下有“CoT@32”的小字注释, 这意味着它运用了思维链提示技巧, 尝试了32次, 并从当中挑选最好结果。GPT-4是无提示词技巧给5个示例作为对比, 在依据这个标准的情况下, Gemini Ultra的测试结果实际上是83.7%, 这样的结果低于GPT-4的86.4%。
要是使用同样的CoT@32这种方式在相同情况下, 虽是成绩一直比Gemini Ultra低, 然而GPT-4却有着达到87.29%的得分率。

在各种条件之下, Gemini于MMLU测试时所获得的分数, 与GPT于MMLU测试时所获得的分数相比较。来源是谷歌。
假设情况如同谷歌DeepMind首席科学家杰夫·迪恩(Jeff Dean)所回应的那般, 这样的一种写法, 仅仅是用以展现两种彼此各异的方法之间的比较, 那么, 对于Gemini测试视频的质疑, 就会显得愈发难以进行反驳。
有这么一件事, 谷歌在推出Gemini之后, 紧接着发了一个演示视频 , 这个视频时长是六分钟 , 视频里展现出了测试员跟Gemini之间一些挺好玩的互动 , 这里面包含好多内容, 比如说让Gemini做到识别图片并且用多种语言去进行描述 , 又比如说让Gemini依据一张地图来设计智力问答 , 另外还有和Gemini玩杯子游戏以及推理小游戏之类的。在这一整个过程当中 , Gemini的反应速度特别快 , 它还能够生成音频以及图片去佐助回答相关问题 , 并且运用上一些口语性质甚至是幽默风格的表达 , 真的是让人感觉特别新奇 , 眼界大开。
然而, 很快网友就从视频开篇文字免责声明里发现问题, 他们觉得这可能暗示视频展示的是精心挑出的好结果, 并非实时录制, 而是经过剪辑的。随后, 谷歌在一篇博客文章中解释了多模态交互过程, 从根本上基本间接承认了只有借助静态图片跟多段提示词拼凑, 才能够达成演示视频里的效果。

譬如, 于文章里, 谷歌予以承认, 有别于视频里针对猜拳手势的那种快速反应, 唯有在向Gemini一并展示这三大手势还提示其这属于游戏之际, Gemini才会得出猜拳游戏的结论。官网截图。
有观点剖析表明, 这般情形跟谷歌于视频里所隐晦示意的状况, 简直是截然不同, 源于从彼视频予以观察, Gemini能够于每一时刻监测周遭的世间万物进而作出相应反应, 并且用户能够同Gemini展开顺畅无阻的语音交流对话。沃顿商学院的教授伊桑·莫利克(Ethan Mollick)同样于X平台之上展开了相关演示, 要是运用静态图片以及多组提示词, 完全能够借由GPT Plus去复刻Gemini的表现。

伊桑·莫利克把谷歌演示视频里的好多张截图一同给GPT Plus展示, GPT Plus居然也能够给出差不多的答案。
在外媒质疑发酵之后, 谷歌DeepMind的产品副总裁是伊莱·柯林斯(Eli Collins), 他对外媒做出了回应, 称视频里画鸭子的演示, 也就是画一个鸭子的简笔画, Gemini能够对其中每一个步骤都做出正确解释, 这确实属于研究级别的功能, 并且至少到目前为止, 它还没有在谷歌的实际产品当中出现。
谷歌DeepMind研究负责人副总裁奥里奥尔·维尼亚尔斯, 也就是深度学习负责人, 在X(原推特)平台发布长文。其中解释了团队制作该视频的方式, 称视频里所有用户提示和输出都是真实的, 只是因简洁而被缩短。维尼亚尔斯还表示, 该视频展示了用Gemini构建的多模态用户体验的样子, 这么做是为激励开发人员。

有谷歌的员工, 向外国媒体透露, 他们觉得这段视频, 描绘出了一幅“不切实际的画面”。有员工表明, 对于这种夸张的演示, 并不感到惊奇, 因为员工们, 已经习惯了公司, 会在某种程度上,对产品进行夸大营销开云正版app下载开云app在线入口,说: “我觉得大多数使用过大语言模型技术的员工开云真人app在线登录, 都明白, 要对(演示中的)这一切, 保持保留态度。”。
有外国媒体持有这样的看法, 谷歌存在着这般庞大的官僚体系,以及各级别的产品经理开云app在线入口,开云真人官方下载, 致使其直至如今都没办法如同OpenAI那般敏捷地去推出产品。对于当下正在应对AI转型所带来影响的社会来说, 这并非称得上是一件坏事。然而针对于谷歌最近呈现出的这种迅速推进的表现, 应当持有一定程度的保留态度。
标签: 谷歌Gemini AI大模型 市场反应 夸大宣传 商业化策略
还木有评论哦,快来抢沙发吧~