又是一个不眠之夜,神仙扎堆献技。
当地时间12月6日, 谷歌首席执行官 Sundar Pichai 宣布 Gemini 1.0 版本正式上线, 此前, 这款肩负谷歌厚望、用以对抗 OpenAI 的工具, 其发布时间持续被延迟。
未曾料到世界杯2026直播平台世界杯直播平台,来得如此猝不及防。
代表 Gemini 团队的谷歌 DeepMind CEO, 也即研发负责人 Demis Hassabis, 在发布会上正式推出了大模型 Gemini, 它具备「视觉」, 拥有「听觉」, 并且有着学习和推理能力。
相较于GPT-4, Gemini在多数基准测试里展现出了超越性, 它是谷歌截至目前最为强大、最为全面的模型。

Hassabis在发布会之前, 接受了连线杂志专访, 期间, 他把Gemini称作“新AI品种”。
当前, 绝大多数模型借助训练单独模块之举, 并把它们连接在一起实现对多模态的近似, 其欠缺之处在于无法于多模态空间开展深层复杂推理。
Gemini 的最大亮点之一, 乃是原生多模态大模型, 其在设计之时, 便原生支持多模态, 具备处理不同形式数据的能力, 所谓不同形式数据指的是语言、听力以及视觉方面的数据, 它从一开始就在不同模态上展开预训练且利用额外的多模态数据进行微调, 以此来提升有效性。
所以, Gemini能够泛化且可无缝地理解、操作以及组合不同种类的信息, 其中涵盖文本、代码、音频、图像还有视频, 远比现有的(近似的)多模态模型出色, 而且它的能力在差不多每个领域都是最为强大的。
哈萨比斯透露, 谷歌深度思维已在钻研怎样把杰米尼与机器人技术相融合, 从而同世界展开物理交互, 毕竟若要成为真正的多模态, 还需触摸以及触觉的反馈。
他向连线杂志表明, 有一条路, 先前从未有前人在上踏过, 未来或许会带来重大崭新突破, 新的多模态模型会成为智能体、规划和推理、游戏甚至物理机器人快速创新的根基。
谷歌称, Gemini是其迄今最为灵活的模型, 能在数据中心、移动设备等多类型平台上高效运行, 除了原生多模态的亮点外。
Gemini 含有三种量级, 其中有能力最为强大的 Gemini Ultra, 有适用于多任务的 Gemini Pro, 还有适用于特定任务以及端侧的 Gemini Nano。

目前Gemini 提供了三个不同版本
尤其值得一提的是 Gemini Nano开运真人app下载苹果版,开运真人app下载,它能够依托使用特殊芯片的终端设备来运行, 并非是于云端的某些服务器而运行, 像是这般, 谷歌便能够把生成 AI 引入至那些散布于世界各个角落的安卓手机当中。
同时, 使用生成AI模型, 在没有网络连接的状况下, 会使用户觉得安全, 其个人数据不会脱离其设备, 这亦是苹果多年来隐私实践的趋向。

采用Gemini Nano的Pixel 8 Pro, 能在录音机应用里对会议音频予以总结, 哪怕不存在网络连接状况, 同样能够达成这一结果。
据传, Pixel 8 Pro 会是首部运行 Gemini Nano 的智能手机, 尽管谷歌已把它和 Pixel 8 Pro 的操作系统加以整合, 然而却还没将其所有功能嵌入 Google Assistant。
在新闻发布会上, 谷歌副总裁, 同时身为 Bard and Assistant 总经理的 Sissie Hsiao 宣称, 当下正针对这一联姻开展「早期测试」。
写到这里,我们几乎可以嗅到未来在终端,谷歌势必与苹果一战。
接下来的若干个月, 谷歌的聊天机器人 Bard 将会迎来意义重大的升级, 此升级会运用 Gemini Pro 的微调版本去执行更为高级的推理任务, 执行更为高级的规划任务, 执行更为高级的理解等任务。在不久的未来之时期, Bard 还将会扩展至更多的模态范围, 还会支持更多种类的语言。
公司宣称, Gemini将要在往后的几个月当中, 被引入至别的谷歌产品之内, 其中涵盖生成搜索, 广告以及Chrome这几类。
正处于持续开展状态的, 最具强大程度版本Ultra的安全测试工作, 计划于明年予以推出。在大规模多任务语言理解, 也就是MMLU基准测试里, 其获得了占据成果百分之九十的分数, 比包含GPT - 4在内的其他任何竞争对手都要更高, 都要更突出。
然而, 谷歌并未将人工智能领域的风头全部抢走。Meta、AMD皆碰巧有了新的发布。
为了防止被他人超越, 虚拟助手Meta AI有了重要更新, 就在昨晚。

文本到图像生成功能, 这最为常用功能当中的其中之一, 也就是Imagine, 如今有着了「重新想象」这般的新能力, 把聊天斗图朝着新高度去推进了, 可以这么讲:
使用Imagine去生成一张图片, 你的聊天对象能够按住这张图片, 凭借简单文本提示来进行修改, 新功能会制造出一张新的图片。网友们可以如同接龙那般持续地修改图片, 疯狂地搞笑。
Meta推出了一个免费网络工具想象与Meta AI, 这是一个在线AI图像生成器, 其网址为https://imagine.meta.com/ , 它能够在几秒钟内创建高分辨率的AI图像,它是使用公共Facebook数据来进行训练的。

每一回运用, 生成器都会缔造四张,像素为1280×1280的图像, 可以用JPEG形式予以保存, 图像的左下角有着一个极小的「 Imagined with AI 」水印。

这幅屏幕截图, 是由兰斯·惠特尼, 通过想象公司, 经由ZDNET获取而来的。

来自arstechnica的作品
在文生图功能被排除在外的情况下, Meta AI 的文案能力出现了提升, 举例来说便是, 在撰写生日祝福、帖子以及交友资料的自我介绍方面能够提供帮助。
Meta AI 也推出了 Reels 功能, 要是你正处于在群聊里打算跟朋友一同去旅行的状况, 那么能够要求 Meta AI 给出最佳游览地点的推荐, 并且分享热门景点, 进而决定哪些景点是一定要去的。


现在还能帮忙将图像从横向转换为纵向,更方便分享到文本中。
翻开大模型竞争硬币另一面,是各家深陷的最强算力军备。
发布会上, 有与Gemini 1.0一同亮相的事物, 那便是谷歌到目前为止最为强大、最为高效且具备可扩展性的TPU系统, 也就是Cloud TPU v5p, 它是专门为训练处于尖端水平的AI模型而设计的, 能够在训练大模型时比TPU v4速度更快。
谷歌宣称, TPU对于它在Gemini这类顶尖模型上开展规模最为庞大的研究以及工程作业很是关键。
还是昨晚, AMD推出了一款芯片, 它被称作「最强算力」芯片, 是专为AIGC和大模型场景打造的纯GPU产品, 这款产品就是Instinct MI300X加速器, 它隆重地亮相了。
AMD宣称, 针对英伟达H100 HGX而言, Instinct MI300X加速器于运行大语言模型推理之际,无论是吞吐量方面, 还是时延表现方面, 均显著地展现出更为出色的状况, 超出许多。

AMD MI300X 人工智能加速器
苏姿丰身为 AMD CEO, 预计人工智能芯片市场待到 2027 年时, 将会达到 4000 亿美元或者更多的数额, 期望 AMD 在该市场可以占据挺大的份额。
AMD 跟一些超渴望 GPU 的公司签了约, 让用该芯片, 这其中有 2023 年 Nvidia H100 GPU 两个最大买家, 分别是 Meta 和微软。
Meta宣称, 会运用MI300X GPU去开展AI推理工作负载的处理行动, 像是处理AI贴纸, 进行图像编辑, 以及处理AI助手。
作出表述的是微软首席技术官Kevin Scott, 声称的是该公司会借助Azure来给予对MI300X芯片的访问途径。”。
甲骨文所提供的云服务, 也会启用这类芯片 , OpenAI宣称, 其公司自行研发的GPU编程语言Triton, 自后续即将到来的3.0版本起, 会对诸如MI300的AMD芯片予以支持。
参考链接
https://about.fb.com/news/2023/12/meta-ai-updates/
https://www.wired.com/story/google-deepmind-demis-hassabis-gemini-ai/
还木有评论哦,快来抢沙发吧~