发布 Grok 4.3 的 xAI, 未将声量拉升至最大程度, 马斯克甚至未曾单独发布推文, 看上去仅是属于一个过渡性质的版本。

https://x.com/elonmusk/status/2045590599206875216
它更像是一回静谧的产品换挡 , 将模型放置进 API , 把价格压低 , 把工具能力补足 , 然后告知开发者能够从旧版 Grok 迁移过来。
没有那种关于通用人工智能的宏伟叙事, 并且也缺少了马斯克式的那种宣称即将彻底改变所有状况的表述, 这样一来, 反倒使得Grok 4.3看上去更加具有真实感了。
对于普通消费者而言, Grok 4.3最重要的改变, 不是某个榜单的分数提高了些许, 而是AI助手越来越造价低廉, 运行速度迅速提升且更加接近, 能够替人完成文件、表格以及演示文稿的称职助手。
然而, Grok 4.3 的聪慧程度, 依旧没有赶上 GPT - 5.5, 以及 Claude Opus 4.7。
它是一款性价比很强的新模型,也是一款仍有明显天花板的模型。
需要消费者真正予以关心的, 是它于哪些场景能够实现省钱以及省时间, 在哪些场景会由于判断不准确、思考时间过长或者表述过多, 进而反倒致使成本增加。
它确实变强了
尤其像一个更会干活的助手
Artificial Analysis 把 Grok 4.3 的 Intelligence Index 打到了 53 分, 这个分数比 Grok 4.20 0309 v2 高 4 分, 且它还超过了 Claude Sonnet 4.6 和 Muse Spark。

不算小的这个提升, 特别是于xAI自家模型线当中, Grok 4.3已然是当下最强的一档之一, 是这样的情况。
更值得看的是代理任务表现。
Grok 4.3, 于 GDPval - AA 上, 获取到 1500 Elo 的分数, 相较于 Grok 4.20 0309 v2 的 1179 分, 提升了 321 分。 句号不能少哦!

这个榜单, 较贴近日常那种「让AI去做事」的情形, 像是对资料予以整理, 去执行繁杂步骤, 对真实工作流加以处理, 这对于普通用户而言, 会具备实际意义。
驱使AI助力撰写周报, 搭建表格, 制作方案, 拆解会议纪要, 生成PPT, 由此Groq 4.3的体验会相较于前代更为完整。
Grok 能够制作展示文稿, 能够生成文档, 还能够创建电子表格, 能够于一个计算机环境当中撰写出代码, 能够在该环境里运行代码, 能够在这个环境下安装依赖, 并且能够产出文件。
对于那些不懂得代码的用户而言, 这有着这样的意义, 那就是许多原本需要在Excel、PowerPoint以及浏览器之间进行来回切换的操作, 有可能会被压缩成为一句指令。
这同样是AI消费级产品切实应当展开竞争的所在之地, 用户更为在乎的是, 它究竟可不可以将一份报销表完成, 可不可以把一项旅行计划安排妥当, 可不可以创作一封措辞恰当的邮件✔。
Grok 4.3 在这部分的进步,是真进步。
更便宜
是这次最直接的产品卖点
Grok 4.3 的价格很有侵略性。
它的API价格, 是每百万输入Tokens为1.25美元,每百万输出Tokens为2.50美元, 跟Grok相比较, 4.20 的输入价格低了大约40%, 输出价格低了大约60%。

“人工分析”推测计算得出, 运行一整套“智能指数”评测所需花费大概是395美元, 相较于“格罗克”4.20 0309版本2而言, 要低上约20%。

这会影响消费者,只是方式没那么直观。
绝大部分寻常之人不会径直去调用应用程序编程接口, 可是他们会用到依仗于此构建起来的产品呀。
针对AI写作工具而言, 客服机器人, 包含语音助理, 还有教育应用以及办公插件、背后都得给模型调用支付费用。
若底层模型价格出现下降情况, 那么应用厂商便拥有一定空间去降低订阅费用, 又或者是在维持同样价格的条件下, 能够提供更多的次数, 以及更长的上下文内容, 还有更复杂的任务。
Grok 4.3 还有一个优势是速度。
, 人工智能分析的xAI模型页面呈现, 它乃是xAI当下输出进程 quickest 的模型个体之一。每秒可执行约 196 Tokens 的操作, 归属于速度相当快的类别组别之中。

就语音聊天而言, 等待时间会直接影响体验, 对于实时客服是如此, 再者长文生成也一样, 批量内容处理同样会受等待时间直接影响体验。
然而在速度方面有一个细微之处很容易被忽视, 那就是, Grok 4.3 的首个 Token 延迟并非处于较低水平。
它会先「想一会儿」,然后快速输出。
很长的答案当中, 这般速度的优势显著突出;简短的对话里面, 用户也许会先历经停顿的感受, 而后才会体会到快的感觉。
用于客服、语音助手、移动端聊天时世界杯直播平台,这个差异会被放大。
它更会说人话
这是 Grok 的隐藏优势
Grok 一直有一个微妙优势:语气更像真人。
Hacker News里有人讲了, 有些英语不算母语的用户瞧着, Grok在拿捏文本语气这方面, 还有正式程度这块儿, 以及微妙人际表达里头, 都比别的模型更显得自然。
有人将它与GPT、Claude相比较, 觉得在朋友间非正式语气方面, 在同事间沟通方面, 在语音输入识别方面, Grok所展现的表现更趋近于真实的交流状态。

https://news.ycombinator.com/item?id=47972447
Grok 可能受益于 X 平台海量口语化表达训练。
它更易于逮住社交网络当中的语气、节奏以及松弛感等;它也或许会由于这个而承袭社交网络的噪音、偏见还有表达习惯。
于C端用户而言, 这样一种“更自然”的能力, 会使得Grok在撰写消息之时, 在口语转写的情况之下, 在语音助手的范畴之内, 在轻办公场景当中, 变得格外讨喜。
它未必最聪明,但可能更像一个愿意按你的语气说话的助手。
Yes, BUT...
它无法与GPT - 5.5相比较, 它也比不过Claude Opus 4.7。
Grok 4.3 最为突出的缺陷, 在于它看似已然临近第一梯队的边际, 然而却尚未处于最前端那个位置。
Grok 4.3的Intelligence Index是53, GPT - 5.5的Intelligence Index是60, Claude Opus 4.7的Intelligence Index是57。
这个差距不只是排行榜上的几分。
它对于普通消费者而言, 会在复杂推理方面体现出来, 会在代码调试方面体现出来, 会在长文核查方面表现出来, 会在专业咨询方面呈现出来, 还会在多步骤任务的稳定性上有所展现。
Grok 4.3在GDPval - AA上提升幅度颇大, 然而其仍落后GPT - 5.5 xhigh达276 Elo, 按照标准Elo公式来算, 面对GPT - 5.5时预期胜率约为17%。
它在幻觉控制上也有代价。
Grok 4.3当中, AA - Omniscience Accuracy(准确率)有了提升, 提升幅度为8分, 然而, Non - Hallucination Rate(非幻觉率)却出现下降, 下降了8分。

这里的准确率跟非幻觉率不一样, 准确率是看你答对了多少, 非幻觉率则是看在你没答出来的问题当中, 有多少是模型老老实实承认自己不会的, 不会却还振振有词开云app官方最新下载地址,这就是所谓的「幻觉」。
也就是说, Grok 4.3 在范围上的知识涵盖比率呈现出提升态势, 然而, 在出现虚幻不实情况方面的可能性却有所增大了。
消费者最害怕的情形是, AI给出回答时, 显得极为流畅, 表现得十分自信, 看上去特别像回事, 但偏偏关键事实之处却是错误的。
人类已经很擅长自信地犯错,机器不必急着加入这个传统项目。
这表明, 于医疗、法律、金融、学术以及工程等具有高风险特性的场景当中, Grok 4.3依旧得慎重运用。
它适合用来帮用户去起草相关文件, 将其进行整理, 进而生成初稿, 它适合去做那种低风险的辅助类工作;但若涉及到最终的判断, 则 GPT - 5.5 和 Claude Opus 4.7 仍旧是更为稳妥的。
长上下文和工具能力很好
但消费者买账的是结果
Grok 4.3 给出 100 万 Token 上下文窗口, 这对于长文档而言很具吸引力, 对于代码库来说具备吸引力, 对于合同来讲有吸引力, 对于报告而言是有吸引力的, 对于资料库也是有吸引力的。

用户可以丢进去更多材料,让模型在更完整的信息环境里工作。
对研究、办公和创作来说开云真人app官网登录app,这是一种实用能力。
它能够支持文本输入, 它也能够支持图像输入, 可输出文本, 并且围绕工具调用能力进行加强, 有着网页搜索的能力, 还有X搜索的能力同样被加强, 代码执行能力加强于此, 文件搜索能力也加强, RAG等能力一并加强。
xAI推出了Custom Voices产品, 推出了语音代理产品, 推出了TTS产品, 推出了STT产品等;其将Grok的边界从文字进行了扩展, 扩展到了语音。
对于普通用户而言, 往后的 Grok, 或许并非仅仅只是一个聊天框, 而是那样一个能够读取文件的, 能够查询网页的, 能够撰写表格的, 能够说话的, 能够听话的多模态助手。
问题在于,功能多不等于体验好。
对于消费级AI的竞争而言, 最终将会回归到三个朴实无华的标准, 首先是等待的时间要少, 其次是出现错误的情况要少, 最后是折腾的状况要少。
Grok 4.3, 于「少等」方面显著迈进, 于「少花钱」方面明显进步, 然而, 在「少错」方面, 尚未给出足够强有力的答案。
Grok 4.3 的准确定位:
性价比模型,不是最强模型
Grok 4.3, 其所具备的最适配定位, 乃是一款拥有高性价比特性的工作型模型。
它适宜高频内容的生成, 用以进行语气的改写, 可开展长文本的初筛, 适用于语音类产品, 在客服情景中能发挥作用, 可应对批量办公任务, 还适合轻量级的代理工作流。
它也适宜于那些针对成本敏感的产品, 那些针对响应速度敏感的产品, 那些对于最强推理没有执着念头的产品。
对于众多消费者而言, 并非每次都非得调用最强的模型, 好似买菜之时, 不应当仅仅是为了买菜这一目的而去驾驶超跑, 除非是另有企图, 是有别样的图谋。
若任务有着深度推理的要求, 有着严谨事实核查的要求, 有着复杂代码的要求, 有着数学证明的要求, 有着长期项目记忆的要求, 还有着专业判断的要求, 那么Grok 4.3还不该成为第一选择。
GPT - 5. 5, 仍旧是更适宜承担那些高价值、高风险任务的, Claude Opus 4. 7, 同样也是更适合去承当此类高价值、高风险任务的。
此次, xAI 的策略明晰, 先是将模型塑造得足够强大, 接着把价格压低, 凭借速度以及工具能力使可用场景得以扩展。
它未曾获取「最为聪慧模型」的名号, 不过或许会拿走一部分实际使用数量。
因为市场并不总奖励最强者,也奖励够强、够快、够便宜的选择。
Grok 4.3 的意义所在之处就在这儿, 它将 xAI 从一个常常凭借马斯克的声量来吸引关注的模型供应商, 朝着更讲求实际的 API 和竞争消费者级工具的方向, 往前推动了一步。
它看上去蛮不错, 的确是挺好;只不过还没好到那种程度, 能让GPT - 5.5以及Claude Opus 4.7感到紧张不安。
消费者可以期待它降价、提速、让更多 AI 应用变得便宜。
该记住, 在需要真正具备聪明特质以及可靠特性的地方, Grok 4.3 依旧仅仅是可供选择的项目之一。
还木有评论哦,快来抢沙发吧~