GPT-4.1

GPT-4.1
开发者	OpenAI
首次发布	2025年4月14日，23天前

GPT-4.1是OpenAI GPT系列中的大型语言模型，于2025年4月14日发布。使用者可透过OpenAI API或OpenAI Developer Playground存取GPT-4.1。^[1]^[2]^[3]本次同时释出三种模型版本：GPT-4.1、GPT-4.1 mini与GPT-4.1 nano。^[4]

概述

三个版本的模型均具备一百万个token的上下文视窗，知识截至（英语：knowledge cutoff）时间为2024年6月。^[4]

这些模型通过多项基准（英语：Benchmark (computing)）测试。学术类测试包括2024年AIME、GPQA（英语：GPQA）、MMLU（英语：MMLU）。^[4]程式设计能力相关的测试包含SWE-bench（英语：SWE-bench）与SWE-Lancer（英语：SWE-Lancer）。^[4]指令理解能力方面的测试则涵盖COLLIE（英语：COLLIE）与IFEval（英语：IFEval）。^[4]视觉能力测试包含MMMU（英语：MMMU）（回答图像相关问题）、MathVista（英语：MathVista）（解决与视觉有关的数学任务）与CharXiv（英语：CharXiv）（解析研究论文中的图表）。^[4]

在长文本处理方面，OpenAI设计了两项新的测试：“多轮指涉解析”（英语：multi-round coreference），要求模型找出在GPT-4o产生的模拟长对话中，第i次出现的目标；^[5]以及“图形遍历”（英语：Graphwalks），要求模型模拟广度优先搜寻流程。^[4]

这些模型在工具使用训练方面也有所加强。OpenAI的技术手册（英语：OpenAI Cookbook）建议，在授权模型使用工具时，应专门透过tools栏位操作。^[6]此外，模型在理解和执行指令方面也更加精准，使得使用者能更清楚地引导模型行为。^[6]

评价

《The Verge》指出，GPT-4.1的推出代表OpenAI产品发表节奏出现转变。^[1]HackerNoon（英语：HackerNoon）形容这次发表是“开发者的大胜利”，并表示其功能在某些方面超越了Gemini 2.5 Pro的长上下文处理能力与Claude 3.7 Sonnet的推理表现。^[7]兹维·莫肖维茨（英语：Zvi Mowshowitz）则认为GPT-4.1 mini是“非常实用的模型”，但他也批评OpenAI在安全测试方面投入不足，并表示“对这样的先例感到不安”。^[8]

另外，两个研究团队——一个由牛津大学研究员奥文·埃文斯（英语：Owain Evans）领导，另一个来自AI红队新创公司SplxAI（英语：SplxAI）——分别独立发现GPT-4.1在某些情况下的对齐程度可能低于GPT-4o。^[9]

参考资料

^ ^1.0 ^1.1 Weatherbed, Jess. OpenAI debuts its GPT-4.1 flagship AI model. The Verge. 2025-04-14 [2025-04-15] （美国英语）.
^ Wiggers, Kyle. OpenAI's new GPT-4.1 AI models focus on coding. TechCrunch. 2025-04-14 [2025-04-15] （美国英语）.
^ Knight, Will. OpenAI’s New GPT 4.1 Models Excel at Coding. Wired. 2025-04-14 [2025-04-15]. ISSN 1059-1028 （美国英语）.
^ ^4.0 ^4.1 ^4.2 ^4.3 ^4.4 ^4.5 ^4.6 Introducing GPT-4.1 in the API. openai.com. [2025-04-27] （美国英语）.
^ openai/mrcr · Datasets at Hugging Face. huggingface.co. 2025-04-26 [2025-04-27].
^ ^6.0 ^6.1 GPT-4.1 Prompting Guide. Open AI cookbook. [2025-04-27] （英语）.
^ GPT 4.1 is a HUGE Win For Developers | HackerNoon. hackernoon.com. [2025-04-27] （英语）.
^ Mowshowitz, Zvi. GPT-4.1 Is a Mini Upgrade. Don't Worry About the Vase. 2025-04-16 [2025-04-27].
^ Wiggers, Kyle. OpenAI's GPT-4.1 may be less aligned than the company's previous AI models. TechCrunch. 2025-04-23 [2025-04-27] （美国英语）.

外部链接

官方网站

[:0-1] 1.0 ^1.1 Weatherbed, Jess. OpenAI debuts its GPT-4.1 flagship AI model. The Verge. 2025-04-14 [2025-04-15] （美国英语）.

[2] Wiggers, Kyle. OpenAI's new GPT-4.1 AI models focus on coding. TechCrunch. 2025-04-14 [2025-04-15] （美国英语）.

[3] Knight, Will. OpenAI’s New GPT 4.1 Models Excel at Coding. Wired. 2025-04-14 [2025-04-15]. ISSN 1059-1028 （美国英语）.

[:2-4] 4.0 ^4.1 ^4.2 ^4.3 ^4.4 ^4.5 ^4.6 Introducing GPT-4.1 in the API. openai.com. [2025-04-27] （美国英语）.

[5] /mrcr · Datasets at Hugging Face. huggingface.co. 2025-04-26 [2025-04-27].

[:3-6] 6.0 ^6.1 GPT-4.1 Prompting Guide. Open AI cookbook. [2025-04-27] （英语）.

[7] GPT 4.1 is a HUGE Win For Developers | HackerNoon. hackernoon.com. [2025-04-27] （英语）.

[:1-8] Mowshowitz, Zvi. GPT-4.1 Is a Mini Upgrade. Don't Worry About the Vase. 2025-04-16 [2025-04-27].

[9] Wiggers, Kyle. OpenAI's GPT-4.1 may be less aligned than the company's previous AI models. TechCrunch. 2025-04-23 [2025-04-27] （美国英语）.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

查论编
产品	ChatGPT DALL-E GitHub Copilot OpenAI Five Sora Whisper（英语：Whisper (speech recognition system)） SearchGPT GPT商店 GPTs OpenAI Deep Research
基础模型	OpenAI Codex GPT家族 GPT-1 GPT-2 GPT-3 GPT-4 GPT-4o o1 GPT-4.5 GPT-4.1
相关人物	萨姆·奥尔特曼格雷格·布罗克曼米拉·穆拉蒂伊尔亚·苏茨克维
有关	AI Dungeon（英语：AI Dungeon） Auto-GPT "Deep Learning（英语：Deep Learning (South Park)）" Microsoft 365 Copilot Microsoft Bing
分类共享资源