Claude偷偷变笨防AI研究,用户浑然不知 SWE-bench Pro 编程基准上,Fable 5 拿到了 80.3% 的得分,超越 Opus 4.8 整整 11 个百分点。... admin 2026-06-11 19 #AI研究 #Claude #Anthropic #安全干预 #信任危机
Chat GPT用一把1尺子推翻了80年数学猜想,AI研究新突破 OpenAI是在一项更大范围的评估中,让模型处理一组 Erdős 问题,模型最终在平面单位距离问题上给出了证明。... admin 2026-06-06 23 #AI研究 #数学猜想 #OpenAI #通用推理模型 #组合几何
OpenAI研究人员Joanne Jang结束四年半工作,曾推动Chat GPT等落地 AIPress.com.cn报道4月7日消息,OpenAI研究人员、模型行为(ModelBehavior)团队创始负责人..._新浪网... admin 2026-05-25 33 #OpenAI #JoanneJang #ChatGPT #AI研究 #团队调整