GPT-4.1

GPT-4.1
開發者	OpenAI
首次發布	2025年4月14日，23天前

GPT-4.1是OpenAI GPT系列中的大型語言模型，於2025年4月14日發佈。使用者可透過OpenAI API或OpenAI Developer Playground存取GPT-4.1。^[1]^[2]^[3]本次同時釋出三種模型版本：GPT-4.1、GPT-4.1 mini與GPT-4.1 nano。^[4]

概述

三個版本的模型均具備一百萬個token的上下文視窗，知識截至（英語：knowledge cutoff）時間為2024年6月。^[4]

這些模型通過多項基準（英語：Benchmark (computing)）測試。學術類測試包括2024年AIME、GPQA（英語：GPQA）、MMLU（英語：MMLU）。^[4]程式設計能力相關的測試包含SWE-bench（英語：SWE-bench）與SWE-Lancer（英語：SWE-Lancer）。^[4]指令理解能力方面的測試則涵蓋COLLIE（英語：COLLIE）與IFEval（英語：IFEval）。^[4]視覺能力測試包含MMMU（英語：MMMU）（回答圖像相關問題）、MathVista（英語：MathVista）（解決與視覺有關的數學任務）與CharXiv（英語：CharXiv）（解析研究論文中的圖表）。^[4]

在長文本處理方面，OpenAI設計了兩項新的測試：「多輪指涉解析」（英語：multi-round coreference），要求模型找出在GPT-4o產生的模擬長對話中，第i次出現的目標；^[5]以及「圖形遍歷」（英語：Graphwalks），要求模型模擬廣度優先搜尋流程。^[4]

這些模型在工具使用訓練方面也有所加強。OpenAI的技術手冊（英語：OpenAI Cookbook）建議，在授權模型使用工具時，應專門透過tools欄位操作。^[6]此外，模型在理解和執行指令方面也更加精準，使得使用者能更清楚地引導模型行為。^[6]

評價

《The Verge》指出，GPT-4.1的推出代表OpenAI產品發表節奏出現轉變。^[1]HackerNoon（英語：HackerNoon）形容這次發表是「開發者的大勝利」，並表示其功能在某些方面超越了Gemini 2.5 Pro的長上下文處理能力與Claude 3.7 Sonnet的推理表現。^[7]茲維·莫肖維茨（英語：Zvi Mowshowitz）則認為GPT-4.1 mini是「非常實用的模型」，但他也批評OpenAI在安全測試方面投入不足，並表示「對這樣的先例感到不安」。^[8]

另外，兩個研究團隊——一個由牛津大學研究員奧文·埃文斯（英語：Owain Evans）領導，另一個來自AI紅隊新創公司SplxAI（英語：SplxAI）——分別獨立發現GPT-4.1在某些情況下的對齊程度可能低於GPT-4o。^[9]

參考資料

^ ^1.0 ^1.1 Weatherbed, Jess. OpenAI debuts its GPT-4.1 flagship AI model. The Verge. 2025-04-14 [2025-04-15] （美國英語）.
^ Wiggers, Kyle. OpenAI's new GPT-4.1 AI models focus on coding. TechCrunch. 2025-04-14 [2025-04-15] （美國英語）.
^ Knight, Will. OpenAI’s New GPT 4.1 Models Excel at Coding. Wired. 2025-04-14 [2025-04-15]. ISSN 1059-1028 （美國英語）.
^ ^4.0 ^4.1 ^4.2 ^4.3 ^4.4 ^4.5 ^4.6 Introducing GPT-4.1 in the API. openai.com. [2025-04-27] （美國英語）.
^ openai/mrcr · Datasets at Hugging Face. huggingface.co. 2025-04-26 [2025-04-27].
^ ^6.0 ^6.1 GPT-4.1 Prompting Guide. Open AI cookbook. [2025-04-27] （英語）.
^ GPT 4.1 is a HUGE Win For Developers | HackerNoon. hackernoon.com. [2025-04-27] （英語）.
^ Mowshowitz, Zvi. GPT-4.1 Is a Mini Upgrade. Don't Worry About the Vase. 2025-04-16 [2025-04-27].
^ Wiggers, Kyle. OpenAI's GPT-4.1 may be less aligned than the company's previous AI models. TechCrunch. 2025-04-23 [2025-04-27] （美國英語）.

外部連結

官方網站

[:0-1] 1.0 ^1.1 Weatherbed, Jess. OpenAI debuts its GPT-4.1 flagship AI model. The Verge. 2025-04-14 [2025-04-15] （美國英語）.

[2] Wiggers, Kyle. OpenAI's new GPT-4.1 AI models focus on coding. TechCrunch. 2025-04-14 [2025-04-15] （美國英語）.

[3] Knight, Will. OpenAI’s New GPT 4.1 Models Excel at Coding. Wired. 2025-04-14 [2025-04-15]. ISSN 1059-1028 （美國英語）.

[:2-4] 4.0 ^4.1 ^4.2 ^4.3 ^4.4 ^4.5 ^4.6 Introducing GPT-4.1 in the API. openai.com. [2025-04-27] （美國英語）.

[5] /mrcr · Datasets at Hugging Face. huggingface.co. 2025-04-26 [2025-04-27].

[:3-6] 6.0 ^6.1 GPT-4.1 Prompting Guide. Open AI cookbook. [2025-04-27] （英語）.

[7] GPT 4.1 is a HUGE Win For Developers | HackerNoon. hackernoon.com. [2025-04-27] （英語）.

[:1-8] Mowshowitz, Zvi. GPT-4.1 Is a Mini Upgrade. Don't Worry About the Vase. 2025-04-16 [2025-04-27].

[9] Wiggers, Kyle. OpenAI's GPT-4.1 may be less aligned than the company's previous AI models. TechCrunch. 2025-04-23 [2025-04-27] （美國英語）.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]

閱論編
產品	ChatGPT DALL-E GitHub Copilot OpenAI Five Sora Whisper（英語：Whisper (speech recognition system)） SearchGPT GPT商店 GPTs OpenAI Deep Research
基礎模型	OpenAI Codex GPT家族 GPT-1 GPT-2 GPT-3 GPT-4 GPT-4o o1 GPT-4.5 GPT-4.1
相關人物	薩姆·奧爾特曼格雷格·布羅克曼米拉·穆拉蒂伊爾亞·蘇茨克維
有關	AI Dungeon（英語：AI Dungeon） Auto-GPT "Deep Learning（英語：Deep Learning (South Park)）" Microsoft 365 Copilot Microsoft Bing
分類共享資源