4月15日凌晨,OpenAI正式推出GPT-4.1系列模型,包括标准版GPT-4.1、轻量高效的GPT-4.1 mini和超小型性价比之选GPT-4.1 nano。
GPT-4.1系列在多模态处理、代码能力、指令遵循和成本方面实现显著提升。其最大亮点是支持100万token的上下文处理能力,是GPT-4o的8倍,这也是OpenAI首次发布长窗口模型。这一突破使得模型能够处理超长文本,如8套完整的React源码或成百上千页文档,适用于法律、金融、编程等领域的复杂任务。
在编码能力测试中,SWEBench评估将模型置于 Python 代码库环境,让其探索代码库、编写代码和测试用例。结果显示,GPT-4.1 的准确率达到 55% ,而 GPT-4o仅为 33%。
在多模态处理测试的视频 MME 基准测试中,GPT 4.1 对30到60分钟无字幕视频进行理解并回答多项选择题,取得72%的成绩,达到当前最佳水平,在视频内容理解上实现重大突破。
GPT-4.1系列在提升性能的同时,价格更具竞争力。GPT-4.1 相比 GPT-4o 价格降低 26%,而GPT-4.1 Nano 作为最小、最快的模型,价格也最便宜,每百万 token 的成本仅为12美分。
目前,GPT-4.1系列仅通过API提供,已对所有开发者开放。Windsurf决定为所有用户提供一周免费体验,随后以大幅折扣继续提供该模型。
不过,此次新发布的模型命名逻辑引发不少人吐槽,Open AI 不久前刚发布GPT-4.5,还夸赞GPT-4.5是比4聪明10倍的模型,转眼就又推出了 GPT-4.1,而且这次没说明,为何数字命名又倒退了。
不过,此次发布也意味着OpenAI正逐步淘汰旧模型,GPT-4.5预览版将于7月14日从API中下线,而GPT-4.1或将成为主流To B服务模型。
另外,GPT-4.1 nano API定价和 Gemini Flash 几乎相同,这是针对Google的又一次狙击。
之前,Gemini 2.0 Flash-Lite与OpenAI的GPT-4o-mini相比,成本更低。例如,GPT-4o-mini的每百万输入费用为0.15美元,输出费用为0.60美元,而Gemini 2.0 Flash-Lite的输入和输出费用分别为0.075美元和0.30美元。
OpenAI在模型进展不明显的情况下,推出够用且便宜的4.1,目的就是和竞争对手抢占市场,尤其是在B端市场接替3.5和4o mini。
4月10日,谷歌又推出了一款名为 Gemini 2.5 Flash 的全新 AI 模型,继续保持该模型价格较低、性能出色,以吸引用户。
早前,OpenAI 的创始人兼CEO山姆・奥尔特曼在社交平台𝕏上发布消息,宣布本周将推出 “很多” 令人期待的新产品,这些产品将从周二开始陆续上线。
他在本月初还曾提到,OpenAI 可能会在几周内发布新版本的 o3和 o4-mini,并预计在未来几个月发布 GPT-5。他表示,此次发布是为了使 GPT-5的表现超越最初的设想,GPT-5 将整合语音、画布、搜索、Deep Research 等功能,团队在整合各种功能时遇到了意想不到的挑战,因此希望能具备足够的产能来满足日益增长的需求。