xAI发布Grok 4.3,更便宜更快,像合格助手啦

admin AI新闻 21

发布 Grok 4.3 的 xAI, 未将声量拉升至最大程度, 马斯克甚至未曾单独发布推文, 看上去仅是属于一个过渡性质的版本。

xAI发布Grok 4.3,更便宜更快,像合格助手啦-第1张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

https://x.com/elonmusk/status/2045590599206875216

它更像是一回静谧的产品换挡 , 将模型放置进 API , 把价格压低 , 把工具能力补足 , 然后告知开发者能够从旧版 Grok 迁移过来。

没有那种关于通用人工智能的宏伟叙事, 并且也缺少了马斯克式的那种宣称即将彻底改变所有状况的表述, 这样一来, 反倒使得Grok 4.3看上去更加具有真实感了。

对于普通消费者而言, Grok 4.3最重要的改变, 不是某个榜单的分数提高了些许, 而是AI助手越来越造价低廉, 运行速度迅速提升且更加接近, 能够替人完成文件、表格以及演示文稿的称职助手。

然而, Grok 4.3 的聪慧程度, 依旧没有赶上 GPT - 5.5, 以及 Claude Opus 4.7。

它是一款性价比很强的新模型,也是一款仍有明显天花板的模型。

需要消费者真正予以关心的, 是它于哪些场景能够实现省钱以及省时间, 在哪些场景会由于判断不准确、思考时间过长或者表述过多, 进而反倒致使成本增加。

它确实变强了

尤其像一个更会干活的助手

Artificial Analysis 把 Grok 4.3 的 Intelligence Index 打到了 53 分, 这个分数比 Grok 4.20 0309 v2 高 4 分, 且它还超过了 Claude Sonnet 4.6 和 Muse Spark。

xAI发布Grok 4.3,更便宜更快,像合格助手啦-第2张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

不算小的这个提升, 特别是于xAI自家模型线当中, Grok 4.3已然是当下最强的一档之一, 是这样的情况。

更值得看的是代理任务表现。

Grok 4.3, 于 GDPval - AA 上, 获取到 1500 Elo 的分数, 相较于 Grok 4.20 0309 v2 的 1179 分, 提升了 321 分。 句号不能少哦!

xAI发布Grok 4.3,更便宜更快,像合格助手啦-第3张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

这个榜单, 较贴近日常那种「让AI去做事」的情形, 像是对资料予以整理, 去执行繁杂步骤, 对真实工作流加以处理, 这对于普通用户而言, 会具备实际意义。

驱使AI助力撰写周报, 搭建表格, 制作方案, 拆解会议纪要, 生成PPT, 由此Groq 4.3的体验会相较于前代更为完整。

Grok 能够制作展示文稿, 能够生成文档, 还能够创建电子表格, 能够于一个计算机环境当中撰写出代码, 能够在该环境里运行代码, 能够在这个环境下安装依赖, 并且能够产出文件。

对于那些不懂得代码的用户而言, 这有着这样的意义, 那就是许多原本需要在Excel、PowerPoint以及浏览器之间进行来回切换的操作, 有可能会被压缩成为一句指令。

这同样是AI消费级产品切实应当展开竞争的所在之地, 用户更为在乎的是, 它究竟可不可以将一份报销表完成, 可不可以把一项旅行计划安排妥当, 可不可以创作一封措辞恰当的邮件✔。

Grok 4.3 在这部分的进步,是真进步。

更便宜

是这次最直接的产品卖点

Grok 4.3 的价格很有侵略性。

它的API价格, 是每百万输入Tokens为1.25美元,每百万输出Tokens为2.50美元, 跟Grok相比较, 4.20 的输入价格低了大约40%, 输出价格低了大约60%。

xAI发布Grok 4.3,更便宜更快,像合格助手啦-第4张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

“人工分析”推测计算得出, 运行一整套“智能指数”评测所需花费大概是395美元, 相较于“格罗克”4.20 0309版本2而言, 要低上约20%。

xAI发布Grok 4.3,更便宜更快,像合格助手啦-第5张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

这会影响消费者,只是方式没那么直观。

绝大部分寻常之人不会径直去调用应用程序编程接口, 可是他们会用到依仗于此构建起来的产品呀。

针对AI写作工具而言, 客服机器人, 包含语音助理, 还有教育应用以及办公插件、背后都得给模型调用支付费用。

若底层模型价格出现下降情况, 那么应用厂商便拥有一定空间去降低订阅费用, 又或者是在维持同样价格的条件下, 能够提供更多的次数, 以及更长的上下文内容, 还有更复杂的任务。

Grok 4.3 还有一个优势是速度。

, 人工智能分析的xAI模型页面呈现, 它乃是xAI当下输出进程 quickest 的模型个体之一。每秒可执行约 196 Tokens 的操作, 归属于速度相当快的类别组别之中。

xAI发布Grok 4.3,更便宜更快,像合格助手啦-第6张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

就语音聊天而言, 等待时间会直接影响体验, 对于实时客服是如此, 再者长文生成也一样, 批量内容处理同样会受等待时间直接影响体验。

然而在速度方面有一个细微之处很容易被忽视, 那就是, Grok 4.3 的首个 Token 延迟并非处于较低水平。

它会先「想一会儿」,然后快速输出。

很长的答案当中, 这般速度的优势显著突出;简短的对话里面, 用户也许会先历经停顿的感受, 而后才会体会到快的感觉。

用于客服、语音助手、移动端聊天时世界杯直播平台,这个差异会被放大。

它更会说人话

这是 Grok 的隐藏优势

Grok 一直有一个微妙优势:语气更像真人。

Hacker News里有人讲了, 有些英语不算母语的用户瞧着, Grok在拿捏文本语气这方面, 还有正式程度这块儿, 以及微妙人际表达里头, 都比别的模型更显得自然。

有人将它与GPT、Claude相比较, 觉得在朋友间非正式语气方面, 在同事间沟通方面, 在语音输入识别方面, Grok所展现的表现更趋近于真实的交流状态。

xAI发布Grok 4.3,更便宜更快,像合格助手啦-第7张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

https://news.ycombinator.com/item?id=47972447

Grok 可能受益于 X 平台海量口语化表达训练。

它更易于逮住社交网络当中的语气、节奏以及松弛感等;它也或许会由于这个而承袭社交网络的噪音、偏见还有表达习惯。

于C端用户而言, 这样一种“更自然”的能力, 会使得Grok在撰写消息之时, 在口语转写的情况之下, 在语音助手的范畴之内, 在轻办公场景当中, 变得格外讨喜。

它未必最聪明,但可能更像一个愿意按你的语气说话的助手。

Yes, BUT...

它无法与GPT - 5.5相比较, 它也比不过Claude Opus 4.7。

Grok 4.3 最为突出的缺陷, 在于它看似已然临近第一梯队的边际, 然而却尚未处于最前端那个位置。

Grok 4.3的Intelligence Index是53, GPT - 5.5的Intelligence Index是60, Claude Opus 4.7的Intelligence Index是57。

这个差距不只是排行榜上的几分。

它对于普通消费者而言, 会在复杂推理方面体现出来, 会在代码调试方面体现出来, 会在长文核查方面表现出来, 会在专业咨询方面呈现出来, 还会在多步骤任务的稳定性上有所展现。

Grok 4.3在GDPval - AA上提升幅度颇大, 然而其仍落后GPT - 5.5 xhigh达276 Elo, 按照标准Elo公式来算, 面对GPT - 5.5时预期胜率约为17%。

它在幻觉控制上也有代价。

Grok 4.3当中, AA - Omniscience Accuracy(准确率)有了提升, 提升幅度为8分, 然而, Non - Hallucination Rate(非幻觉率)却出现下降, 下降了8分。

xAI发布Grok 4.3,更便宜更快,像合格助手啦-第8张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

这里的准确率跟非幻觉率不一样, 准确率是看你答对了多少, 非幻觉率则是看在你没答出来的问题当中, 有多少是模型老老实实承认自己不会的, 不会却还振振有词开云app官方最新下载地址,这就是所谓的「幻觉」。

也就是说, Grok 4.3 在范围上的知识涵盖比率呈现出提升态势, 然而, 在出现虚幻不实情况方面的可能性却有所增大了。

消费者最害怕的情形是, AI给出回答时, 显得极为流畅, 表现得十分自信, 看上去特别像回事, 但偏偏关键事实之处却是错误的。

人类已经很擅长自信地犯错,机器不必急着加入这个传统项目。

这表明, 于医疗、法律、金融、学术以及工程等具有高风险特性的场景当中, Grok 4.3依旧得慎重运用。

它适合用来帮用户去起草相关文件, 将其进行整理, 进而生成初稿, 它适合去做那种低风险的辅助类工作;但若涉及到最终的判断, 则 GPT - 5.5 和 Claude Opus 4.7 仍旧是更为稳妥的。

长上下文和工具能力很好

但消费者买账的是结果

Grok 4.3 给出 100 万 Token 上下文窗口, 这对于长文档而言很具吸引力, 对于代码库来说具备吸引力, 对于合同来讲有吸引力, 对于报告而言是有吸引力的, 对于资料库也是有吸引力的。

xAI发布Grok 4.3,更便宜更快,像合格助手啦-第9张图片-世界杯直播平台-世界杯2026直播平台-免费观看官方-V3.6.9

用户可以丢进去更多材料,让模型在更完整的信息环境里工作。

对研究、办公和创作来说开云真人app官网登录app,这是一种实用能力。

它能够支持文本输入, 它也能够支持图像输入, 可输出文本, 并且围绕工具调用能力进行加强, 有着网页搜索的能力, 还有X搜索的能力同样被加强, 代码执行能力加强于此, 文件搜索能力也加强, RAG等能力一并加强。

xAI推出了Custom Voices产品, 推出了语音代理产品, 推出了TTS产品, 推出了STT产品等;其将Grok的边界从文字进行了扩展, 扩展到了语音。

对于普通用户而言, 往后的 Grok, 或许并非仅仅只是一个聊天框, 而是那样一个能够读取文件的, 能够查询网页的, 能够撰写表格的, 能够说话的, 能够听话的多模态助手。

问题在于,功能多不等于体验好。

对于消费级AI的竞争而言, 最终将会回归到三个朴实无华的标准, 首先是等待的时间要少, 其次是出现错误的情况要少, 最后是折腾的状况要少。

Grok 4.3, 于「少等」方面显著迈进, 于「少花钱」方面明显进步, 然而, 在「少错」方面, 尚未给出足够强有力的答案。

Grok 4.3 的准确定位:

性价比模型,不是最强模型

Grok 4.3, 其所具备的最适配定位, 乃是一款拥有高性价比特性的工作型模型。

它适宜高频内容的生成, 用以进行语气的改写, 可开展长文本的初筛, 适用于语音类产品, 在客服情景中能发挥作用, 可应对批量办公任务, 还适合轻量级的代理工作流。

它也适宜于那些针对成本敏感的产品, 那些针对响应速度敏感的产品, 那些对于最强推理没有执着念头的产品。

对于众多消费者而言, 并非每次都非得调用最强的模型, 好似买菜之时, 不应当仅仅是为了买菜这一目的而去驾驶超跑, 除非是另有企图, 是有别样的图谋。

若任务有着深度推理的要求, 有着严谨事实核查的要求, 有着复杂代码的要求, 有着数学证明的要求, 有着长期项目记忆的要求, 还有着专业判断的要求, 那么Grok 4.3还不该成为第一选择。

GPT - 5. 5, 仍旧是更适宜承担那些高价值、高风险任务的, Claude Opus 4. 7, 同样也是更适合去承当此类高价值、高风险任务的。

此次, xAI 的策略明晰, 先是将模型塑造得足够强大, 接着把价格压低, 凭借速度以及工具能力使可用场景得以扩展。

它未曾获取「最为聪慧模型」的名号, 不过或许会拿走一部分实际使用数量。

因为市场并不总奖励最强者,也奖励够强、够快、够便宜的选择。

Grok 4.3 的意义所在之处就在这儿, 它将 xAI 从一个常常凭借马斯克的声量来吸引关注的模型供应商, 朝着更讲求实际的 API 和竞争消费者级工具的方向, 往前推动了一步。

它看上去蛮不错, 的确是挺好;只不过还没好到那种程度, 能让GPT - 5.5以及Claude Opus 4.7感到紧张不安。

消费者可以期待它降价、提速、让更多 AI 应用变得便宜。

该记住, 在需要真正具备聪明特质以及可靠特性的地方, Grok 4.3 依旧仅仅是可供选择的项目之一。

标签: xAI Grok4.3 AI助手 性价比 模型评测

发布评论 0条评论)

还木有评论哦,快来抢沙发吧~