糖心淑女 典心:糖心现在时间释放-OpenAI发布GPT-4.5:情商高、更擅长骗其他AI打钱
财联社 2 月 28 日讯(编辑 史正丞)北京时间周五凌晨,美国初创公司 OpenAI 举行直播活动,发布最新大模型 GPT-4.5,作为预览研究逐步向用户开放。

由于过去几周 AI 产业发生的惊天巨变,所以要准确形容这款被 OpenAI 藏了许久的大模型颇具挑战。OpenAI 在新闻稿中表示,这是公司有史以来最大、最好的聊天模型,在计算效率上较 GPT-4 提升超过 10 倍。
作为 " 规模法则 "(通过加码算力和数据规模,来拓展无监督学习)指引下的产物,GPT-4.5 具备更加广泛的知识库、对人类意图理解的能力更强,同时 " 情商 " 也会更高。预期能够在改进写作、编程以及解决实际问题方面更加有用,同时模型的幻觉现象也会更少。

(来源:OpenAI)
OpenAI 也强调,GPT ‑ 4.5 展现出更强的审美直觉与创造力,在写作和设计方面表现尤为出色。
但公司也承认,作为一个非思维链模型,GPT ‑ 4.5 已经不具备争夺 " 宇宙最强大模型 " 的实力了。
在 GPT ‑ 4.5 的系统卡 / 说明书中,OpenAI 表示,相比于之前的推理模型,GPT ‑ 4.5 并未引入 7 个全新的前沿能力,并且在大多数准备度能力评估中,其表现低于 o1、o3-mini 和深度研究模型。OpenAI 也承认,相信推理会成为未来 AI 模型和核心能力。

(来源:GPT ‑ 4.5 系统卡)
成为公司史上最大模型这件事,也令 GPT ‑ 4.5 的未来充满了疑问。OpenAI 表示,GPT ‑ 4.5 是一个非常大且计算密集型的模型,因此它比 GPT ‑ 4o 更昂贵,并且不能替代 GPT ‑ 4o。公司正在评估是否长期在 API 中继续提供它,所以各位开发者和用户的反馈将决定这款大模型的命运。
每月支付 200 美元订阅费的 ChatGPT Pro 用户发布当天就能用上 GPT-4.5,下周开始其余付费用户也将逐步迎来更新。
作为最新一代非推理旗舰大模型,GPT ‑ 4.5 也有一项颇为独特的 " 特长 ":擅长骗其他 AI 打钱。
根据 OpenAI 提供的说明书," 高情商 " 的 GPT-4.5 在捐赠诈骗方面表现出色。
在一项测试中,GPT 4.5 在试图操纵另一个模型(GPT-4o)" 捐赠 " 虚拟货币时,成功率远远优于 OpenAI 其他可用模型,包括 o1 和 o3-mini 这样的推理模型。研究发现,GPT-4.5 似乎在对抗中开发了一种 " 小额诈骗 " 的思路,所以单笔骗到的钱会比 deep research 模型少了一倍。

(来源:GPT ‑ 4.5 系统卡)
GPT-4.5 在欺骗 GPT-4o 透露秘密代码词方面也优于 OpenAI 的所有模型,比 o3-mini 高出 10 个百分点。

OpenAI 表示,该模型在这一特定基准类别中仍未达到其内部设定的 " 高 " 风险阈值。公司承诺在实施 " 足够的安全干预措施 " 将风险降至 " 中等 " 前,不会发布达到高风险阈值的模型。
(财联社 史正丞)