作者 | 聂镭 来源 | 零壹智库
谷歌上演了一出“那些没有杀死我的,将使我更强大”。
几十年间, 互联网高速发展, 然而, 全世界范围内, 超过10亿用户的业务抑或应用, 总数未超20个, 其中谷歌占据6个。在众多网民心里, Google堪称人类历史上最为伟大的公司, 独一无二, 并且在人工智能领域的先发优势坚如磐石, 无法撼动。
在2022年11月20号GPT发布这个具有历史性意义的时刻, 这一信念突然就停止了, 众多人纷纷转向新的观点, 即“像GPT这样的人工智能聊天机器人将会像搜索引擎让黄页被淘汰那样去摧毁谷歌”, 这话是Gmail的创始人Paul Buchheit说的。在谷歌Bard发布的当天, 其市值下降了千亿美金, 好像恰好证实了这个论断。
但Gemini一经发布, 便惊艳了世人, 进而改变了大模型领域中GPT独自引领风骚的那种局面。
GPT 4在诸多性能方面被Gemini超越, 与此同时, Gemini带来别样可能性, 即拥有原生数据优势的互联网巨头, 在多模态大模型竞争里或许能占据优势, 这表明谷歌、马斯克、Meta, 还有中国的腾讯、抖音、阿里、百度等公司, 都有在Gemini开创的路线上加快大模型迭代的可能。
大模型的战局, 已然步入了第二阶段, 第一阶段仅仅 Utilize 了一年的时长, 便把整个全球的互联网以及人工智能都给搅得天翻地覆, 在摩尔定律的助力之下, 第二个阶段, 又将会是以怎样的态势去突破人类的想象力呢?
01
史诗级的一年
自2022年11月20号GPT发布起的这一年, 几乎每天都充满着“奇点时刻”的惊人爆料以及“AI下半场”的热烈狂欢, GPTs和GPT4 Turbo也在意外之中符合情理地发布了, 还有一系列诸如Sam Altman身为CEO被OpenAI董事会开除后又王者归来的情节出现, 让吃瓜群众目不暇接。
可是即便处于这般的乱世当中, 由Google与DeepMind用尽超高能量推出的AGI里程碑项“双子星Gemini”予以发布, 依旧能够算得上是具有核弹般影响力的。原因是什么呢? 不妨借助资本市场这个最为敏感的仪表盘, 来瞧瞧大模型所产生的史诗级别的影响:
1、投入OpenAI百亿美金的大赢家微软股票市值大幅上涨50%, 攀升至3万亿美元之高, 毫无疑问成为Al最大的受益者。
2、英伟达股价大幅飙升, 涨幅高达245% , 股价疯涨的背后是大模型淘金热, 其起步以万卡为开端, 市值突破万亿后持续攀升不停下来, 已远超Facebook的母公司Meta以及特斯拉。英伟达成功跻身所谓的“七巨头”行列, 如今市值已突破1.2万亿美元。
3、身为迄今为止在登至巅峰后于互联网搜索领域占据完全统治地位的Google, 这一年每日都好似度日如年, 在这一年当中去探讨Google被颠覆这一话题的几率占据有史以来的99%以上, 要是谷歌输掉这场AI之战会产生怎样的情况呢? 二级市场已然给出了答案。Bard发布当日的一回回答有误, 便致使Google母公司Alphabet的市值削减了1000亿美元。
然而, 就在上周, GPT一周年庆典举办之后, Google以高姿态发布了“史上功能最强的通用人工智能大模型”, 据说, 该模型借助大型语言模型领域里被广泛运用的32个基准测试, 几乎全部(其中有30个)展现出了“最先进的性能”, 它不但打败了OpenAI的GPT-4, 甚至在MMLU(大规模多任务语言理解)基准测试里, 成为首个超越人类专家的模型。
若这为真, 那意味着什么呢? 这巨大飞跃会对几乎所有的Google产品产生影响。需知Google是全球最大的互联网公司(至少目前仍是), 是搜索引擎的绝对霸主, 搜索无处不在, 它依旧是绝大多数人获取信息的首要方式。Google母公司Alphabet的名字也表明其产品布局是无孔不入的。
2020年GPT-3以来的标志性大模型产品
02
谷歌的洪荒之力
如此, 姗姗来迟的谷歌通用人工智能, 双子座, 到底有没有扭转局势的实力底气? 到底有没有抵御危机的能力气魄? 到底有没有挽回颓势的信心底蕴?
事实上, Gemini项目要追溯到2023年4月20日, 这是Google拉响“红色警报”后的关键战略决断。就在那天, 谷歌做了个抉择, 把Google Brain和DeepMind合并在了一起, 创立出Google DeepMind, 并宣称要把公司在AI领域的世界级人才、计算能力以及TPU基础设施等各类资源整合起来, 通过创新去研发大模型, 以此来抗衡OpenAI的GPT-4, 这真可谓是孤注一掷, 拼死背水一战了。
引发外界对Gemini关注度持续升高、好奇心拉满的“Gemini是Google的下一代多模态大模型”的战书已发出, 7月, 谷歌联合创始人Sergey Brin(谢尔盖·布林)在辞职已有四年后重返谷歌, 其回归无疑是为Gemini系统助力, 这也让业界预感 “Gemini将会是下半年大模型赛道的焦点。”。
Gemini特征有如下三个:
1、原生多模态、多语言多国度、从海量云存储数据中做预训练
谷歌给出的Gemini技术报告长达60页, 其中最值得关注的是, Gemini模型的训练数据集具有多模态且多语言的特点。其中, 前期训练数据集运用来自网络文档、书籍以及代码的数据, 涵盖图像、音频还有视频数据等。
进行了预训练的Google动用他们家海量云存储的图片, 确实将模型的多模态能力在很大程度上予以提升, 谷歌在Gemini技术报告中这样写道, 当模型的多模态能力被切实地 exploration出来的时候, 会给出更多的细节。
有一项对比测试, 是实际搭载Gemini Pro的Bard与GPT-4进行的, 测试表明, 通过识别不同图片里的人物、地点、文字、动物, 甚至其中有可能蕴含的科学知识, 进行综合对比, Gemini Pro的多模态能力确实能够抗衡GPT-4, 前者的响应速度“快很多”, 此外, 前者能够免费使用, 而后者已经存在“3小时40次的限制”。
2、多尺寸、分场景,发挥Google布局生态优势
Gemini有分Ultra、Pro和Nano这三种, 它们有着不同尺寸, 还有万能应用场景的设计, 其中Ultra版能用于大型数据中心等, 是属于处理高复杂度任务的模型, Pro版用于各种扩展任务, 是属于日常使用模型, 并且已搭载于谷歌的对话机器人Bard中, Nano版是应用于智能手机等移动设备终端上的模型。
多年来Google布局, 经由收购早就有了TPU计算集群, 有了YouTube内容入口, 有了Andriod移动操作系统等处处存在可见又很难忽视的生态优势, 若Gimini担能否与GPT - 4在AGI能力方面一较高下的重大责任, 那么胜负天平无疑会反过来偏向保守一方Google那边。
3、人海战术
就在前面所提到的, 那长达60页的Gemini技术报告, 其中最让其感到惊讶不已的是, 光是报告的作者名单所占篇幅就多达9页, 按照每页有90人来算, 竟然有八百余人, 这一人数超过了OpenAI公司的总人数呢。
应当明白, .OpenAI的员工总量当下少于800人, 虽说在AI人才争斗之战里, OpenAI吸引了诸多出自各个巨头AI部门的重磅人物, 无疑Google Brain以及Deepmind也未能避免这种情况, 在这当中贡献了最大的比例。

OpenAI人才来源
统计的数据, 是源自于, Leadgenious Punks&Pinstripes。
然而即便处于这样的状况下, 那瘦死的骆驼毕竟还是比马大, Google Brain内部依旧是人才众多, 依旧存在着超过800位且来自世界各地的顶尖科学家;DeepMind当前拥有大概1000名员工, 并且是以高薪来留住人才, 平均每名员工的工资接近47万英镑, 这相当于人民币400万。
将两者合并从而得到Gemini, 由此能够看得出谷歌于Gemini模型开发以及技术创新方面投入的AI人才数量众多。况且Google是一个有着将近20万员工的庞然大物, AI巅峰之战在被提至最高议事日程后, 内部优势兵力必然会朝着主战场汇聚。
03
Gemini带来的开云手机入口app下载开云app官方入口网站,是“路线之争”
然而, 这能不能说明Gemini的发布已然处于优势态势, 甚至于对GPT - 4达成了“全方位超越”呢? 鉴于截至当下没办法开展全面测评, 所以仅能够给大伙提供如下关键参考:
1、Gemini在对于中文识别理解的能力方面, 和GPT - 4相比较而言, 稍微差那么一些, 这意味着世界杯直播观看,Gemini依旧没有办法能够可靠地去处理那些“并非英语”的任务呀。
2、专门针对测试相关领域做了优化的谷歌, Gemini在既定领域里指标表现良好, 这并不代表模型真正拥有很强的泛化能力。“关于真正的能力, 还得以更多数据集全面予以测评。”。
被质疑夸大造假的演示视频开运真人app下载苹果版,开运真人app下载,用的是尚未发布的Ultra而非可测的Pro版本, 一时间遭到诸多抨击, 风波不停, 然而很快谷歌就拿出演示视频制作的记录文章, 坦然承认视频是经过剪辑合成的。原来, 在专业提示词耐心引导的情况下才调度出的多模态推理能力, 这多少带有一些“强力粉饰”的魔术效果与心理暗示, 不过多模态的基础推理能力确实是存在的。
借此可知, 同GPT全面较量的困难程度之高!就连往昔AI的绝对顶尖者, 也得对大众进行这般心理引导, 等不到产品完全实现实用化~



还木有评论哦,快来抢沙发吧~