跳转到内容

GPT-4.1

维基百科,自由的百科全书
GPT-4.1
开发者OpenAI
首次发布2025年4月14日,​23天前​(2025-04-14

GPT-4.1是OpenAI GPT系列中的大型语言模型,于2025年4月14日发布。使用者可透过OpenAI API或OpenAI Developer Playground存取GPT-4.1。[1][2][3]本次同时释出三种模型版本:GPT-4.1、GPT-4.1 mini与GPT-4.1 nano。[4]

概述

[编辑]

三个版本的模型均具备一百万个token的上下文视窗知识截至英语knowledge cutoff时间为2024年6月。[4]

这些模型通过多项基准英语Benchmark (computing)测试。学术类测试包括2024年AIMEGPQA英语GPQAMMLU英语MMLU[4]程式设计能力相关的测试包含SWE-bench英语SWE-benchSWE-Lancer英语SWE-Lancer[4]指令理解能力方面的测试则涵盖COLLIE英语COLLIEIFEval英语IFEval[4]视觉能力测试包含MMMU英语MMMU(回答图像相关问题)、MathVista英语MathVista(解决与视觉有关的数学任务)与CharXiv英语CharXiv(解析研究论文中的图表)。[4]

在长文本处理方面,OpenAI设计了两项新的测试:“多轮指涉解析”(英语:multi-round coreference),要求模型找出在GPT-4o产生的模拟长对话中,第i次出现的目标;[5]以及“图形遍历”(英语:Graphwalks),要求模型模拟广度优先搜寻流程。[4]

这些模型在工具使用训练方面也有所加强。OpenAI的技术手册(英语:OpenAI Cookbook)建议,在授权模型使用工具时,应专门透过tools栏位操作。[6]此外,模型在理解和执行指令方面也更加精准,使得使用者能更清楚地引导模型行为。[6]

评价

[编辑]

The Verge》指出,GPT-4.1的推出代表OpenAI产品发表节奏出现转变。[1]HackerNoon英语HackerNoon形容这次发表是“开发者的大胜利”,并表示其功能在某些方面超越了Gemini 2.5 Pro的长上下文处理能力与Claude 3.7 Sonnet的推理表现。[7]兹维·莫肖维茨英语Zvi Mowshowitz则认为GPT-4.1 mini是“非常实用的模型”,但他也批评OpenAI在安全测试方面投入不足,并表示“对这样的先例感到不安”。[8]

另外,两个研究团队——一个由牛津大学研究员奥文·埃文斯英语Owain Evans领导,另一个来自AI红队新创公司SplxAI英语SplxAI——分别独立发现GPT-4.1在某些情况下的对齐程度可能低于GPT-4o[9]

参考资料

[编辑]
  1. ^ 1.0 1.1 Weatherbed, Jess. OpenAI debuts its GPT-4.1 flagship AI model. The Verge. 2025-04-14 [2025-04-15] (美国英语). 
  2. ^ Wiggers, Kyle. OpenAI's new GPT-4.1 AI models focus on coding. TechCrunch. 2025-04-14 [2025-04-15] (美国英语). 
  3. ^ Knight, Will. OpenAI’s New GPT 4.1 Models Excel at Coding. Wired. 2025-04-14 [2025-04-15]. ISSN 1059-1028 (美国英语). 
  4. ^ 4.0 4.1 4.2 4.3 4.4 4.5 4.6 Introducing GPT-4.1 in the API. openai.com. [2025-04-27] (美国英语). 
  5. ^ openai/mrcr · Datasets at Hugging Face. huggingface.co. 2025-04-26 [2025-04-27]. 
  6. ^ 6.0 6.1 GPT-4.1 Prompting Guide. Open AI cookbook. [2025-04-27] (英语). 
  7. ^ GPT 4.1 is a HUGE Win For Developers | HackerNoon. hackernoon.com. [2025-04-27] (英语). 
  8. ^ Mowshowitz, Zvi. GPT-4.1 Is a Mini Upgrade. Don't Worry About the Vase. 2025-04-16 [2025-04-27]. 
  9. ^ Wiggers, Kyle. OpenAI's GPT-4.1 may be less aligned than the company's previous AI models. TechCrunch. 2025-04-23 [2025-04-27] (美国英语). 

外部链接

[编辑]