GPT·5
GPT-5是AI初創(chuàng)公司OpenAI開(kāi)發(fā)的一款大型語(yǔ)言模型,作為GPT-4的迭代產(chǎn)品,它在多個(gè)領(lǐng)域展現(xiàn)出了卓越的性能,標(biāo)志著AI進(jìn)化進(jìn)入了一個(gè)新的戰(zhàn)略階段。
基本信息 編輯本段
| 類(lèi)別 | 詳情 |
|---|---|
| 開(kāi)發(fā)公司 | OpenAI |
| 代號(hào) | Orion |
| 產(chǎn)品類(lèi)型 | 大型語(yǔ)言模型、“用于使用語(yǔ)言模型的可下載計(jì)算機(jī)軟件” |
| 模型系列 | GPT-5系列,包含GPT-5、GPT-5mini、GPT-5nano以及GPT-5 - Codex四款模型 |
| 上下文長(zhǎng)度 | 均為400K |
| 最大輸出 | 128K tokens |
| 發(fā)布時(shí)間 | 當(dāng)?shù)貢r(shí)間2025年8月7日(北京時(shí)間8月8日凌晨1時(shí)) |
模型介紹 編輯本段
GPT-5是OpenAI首次將o系列模型的推理能力與GPT系列模型的快速響應(yīng)能力相結(jié)合的產(chǎn)物。它是一個(gè)集成模型(integrated model),融合了大語(yǔ)言模型GPT系列和推理模型o系列,并非單一的語(yǔ)言或者推理模型,而是具備調(diào)度子模型的能力。首次使用了內(nèi)嵌式三位一體集成架構(gòu),系統(tǒng)由三部分組成:
GPT-5 - main模型:處理常規(guī)問(wèn)題。
GPT-5 - thinking深度思考模型:解決復(fù)雜任務(wù)。
實(shí)時(shí)決策的路由機(jī)制:根據(jù)對(duì)話類(lèi)型、復(fù)雜程度、工具需求以及用戶的明確意圖,快速?zèng)Q定使用哪個(gè)模型,自主決定是否進(jìn)入深度思考模式,自動(dòng)匹配最適合的模型。此外,還有額度使用完后啟動(dòng)的mini版本。
其用途廣泛,涵蓋了可下載與語(yǔ)言模型相關(guān)的計(jì)算機(jī)程序和軟件,能生成人類(lèi)語(yǔ)音和文本,處理、生成、理解和分析自然語(yǔ)言。其他功能還包括基于機(jī)器學(xué)習(xí)的語(yǔ)言和語(yǔ)音處理、文本/語(yǔ)音的翻譯、共享用于機(jī)器學(xué)習(xí)和預(yù)測(cè)分析的數(shù)據(jù)集、將音頻數(shù)據(jù)文件轉(zhuǎn)換為文本等。OpenAI還打算提供軟件即服務(wù)(SaaS)功能,并開(kāi)發(fā)和實(shí)現(xiàn)人工神經(jīng)網(wǎng)絡(luò)。
發(fā)展歷程 編輯本段
早期階段
2023月18日,OpenAI向商標(biāo)局(USPTO)提交了“GPT - 5”商標(biāo)申請(qǐng),在申請(qǐng)中將其描述為“用于使用語(yǔ)言模型的可下載計(jì)算機(jī)軟件”,并概述了其用途,與上述模型介紹中的功能相符。
2024年1月,OpenAI首席執(zhí)行官山姆·奧特曼(Sam Altman)接受媒體采訪時(shí)表示,推出可能被稱為GPT - 5的新模型是他的首要任務(wù),并稱GPT - 5“將能夠比現(xiàn)有模型做更多的事情”。
測(cè)試階段
2023年9月,OpenAI官宣招募一批紅隊(duì)測(cè)試人員(Red Teaming Network),邀請(qǐng)不同領(lǐng)域?qū)<以u(píng)估模型。紅隊(duì)測(cè)試是一種安全測(cè)試方法,目的是通過(guò)模擬真實(shí)世界中的攻擊,來(lái)評(píng)估和提升系統(tǒng)或網(wǎng)絡(luò)的安全性。
2024年4月,有網(wǎng)友透露GPT - 5正在進(jìn)行紅隊(duì)測(cè)試,隨后HACKIT AI社區(qū)創(chuàng)始人、網(wǎng)絡(luò)安全架構(gòu)師Yuval曬出OpenAI發(fā)給自己的紅隊(duì)邀請(qǐng)郵件。
截至2024年12月,OpenAI已經(jīng)完成了至少兩次大型訓(xùn)練運(yùn)行,目的是通過(guò)對(duì)大量數(shù)據(jù)的訓(xùn)練來(lái)改進(jìn)模型。最初訓(xùn)練運(yùn)行比預(yù)期慢,了解該項(xiàng)目的人士指出,Orion目前充其量只比OpenAI的公開(kāi)模型要好一些,距離“重大飛躍”還很遙遠(yuǎn),且該模型為期六個(gè)月的訓(xùn)練僅在計(jì)算成本方面就花費(fèi)了約5億美元。同時(shí),相關(guān)媒體報(bào)道稱GPT - 5的研發(fā)進(jìn)程落后于預(yù)期,因其研發(fā)測(cè)試成本巨大,產(chǎn)品效果不理想,預(yù)計(jì)不會(huì)在2024年發(fā)布。
2025年2月13日,OpenAI首席執(zhí)行官薩姆·奧爾特曼宣布,OpenAI將在未來(lái)幾個(gè)月內(nèi)推出名為GPT - 5的模型,并公布了GPT - 5模型的發(fā)展路線圖。該模型將整合OpenAI的大量技術(shù),包括o3,并應(yīng)用于聊天機(jī)器人ChatGPT以及API平臺(tái),不再計(jì)劃將o3作為獨(dú)立模型發(fā)布。免費(fèi)版ChatGPT能在標(biāo)準(zhǔn)智能設(shè)置下無(wú)限制地使用GPT - 5進(jìn)行對(duì)話。
2025年3月,薩姆·奧爾特曼稱,DeepSeek的迅速崛起給OpenAI帶來(lái)了深刻的教訓(xùn)。當(dāng)OpenAI隱藏“思維鏈”(Chain of Thought)功能時(shí),給了競(jìng)爭(zhēng)對(duì)手可乘之機(jī),DeepSeek憑借這一功能實(shí)現(xiàn)了病毒式傳播,這讓OpenAI意識(shí)到免費(fèi)層策略的重要性,并促使其重新審視自身的產(chǎn)品布局。
GPT·52025年4月,薩姆·奧爾特曼對(duì)外透露了公司發(fā)布計(jì)劃的重大轉(zhuǎn)變,宣布在備受期待的GPT - 5發(fā)布之前將推出兩個(gè)中級(jí)大模型。
2025年5月,GPT - 4.1核心研究員Michelle Pokrass透露,構(gòu)建GPT - 5的挑戰(zhàn)在于在推理和聊天之間找到適當(dāng)?shù)钠胶狻?/p>
2025年6月,在墨西哥舉辦的AI Summit峰會(huì)上,兩名OpenAI公司代表透露,公司正在開(kāi)發(fā)下一代基礎(chǔ)模型GPT - 5,并計(jì)劃通過(guò)該模型與競(jìng)爭(zhēng)對(duì)手展開(kāi)更激烈角逐,明確表示GPT - 5即將面世,且性能將遠(yuǎn)超GPT - 4等現(xiàn)有模型。
2025年7月,IT之家消息稱,GPT - 5有望在未來(lái)幾天或幾周內(nèi)正式亮相。有跡象表明,OpenAI正在測(cè)試一個(gè)代號(hào)為gpt - 5 - reasoning - alpha - 2025 - 07 - 13的新模型,該模型已于7月13日定稿,當(dāng)前正處于最終測(cè)試階段。同月,薩姆·奧爾特曼在社交平臺(tái)上確認(rèn),OpenAI準(zhǔn)備在8月初正式推出GPT - 并透露新版本將包括mini和nano等多個(gè)規(guī)模不同的型號(hào),并通過(guò)API向外部開(kāi)發(fā)者和企業(yè)開(kāi)放使用。GPT - 5被設(shè)計(jì)為一個(gè)高度集成的技術(shù)系統(tǒng),旨在融合o系列與GPT系列模型的功能,打造一個(gè)能夠調(diào)用全部工具并勝任多樣化任務(wù)的統(tǒng)一平臺(tái),這一版本被視為推動(dòng)語(yǔ)言模型與高級(jí)推理能力深度融合的關(guān)鍵進(jìn)展。
正式發(fā)布
當(dāng)?shù)貢r(shí)間2025年8月7日(北京時(shí)間8月8日凌晨1時(shí)),OpenAI舉行時(shí)長(zhǎng)超1小時(shí)的線上發(fā)布會(huì),正式推出GPT - 5人工智能模型。GPT - 5面向所有免費(fèi)用戶及眾多付費(fèi)ChatGPT訂閱用戶開(kāi)放,付費(fèi)用戶擁有更高的使用限額,付費(fèi)用戶(Plus、Pro、Team)可獲得更高使用額度或無(wú)限使用。微軟同步宣布將該模型整合至Copilot、Microsoft 365 Copilot、Azure AI Foundry和GitHub Copilot等平臺(tái),標(biāo)志著GPT - 5全面登陸微軟生態(tài)系統(tǒng)。當(dāng)?shù)貢r(shí)間9月15日,OpenAI發(fā)布了GPT - 5 - Codex模型,這是一個(gè)專門(mén)為Agent編程優(yōu)化的模型,同步在Codex CLI、IDE擴(kuò)展、網(wǎng)頁(yè)端、移動(dòng)端以及GitHub代碼審查中可用。
功能特點(diǎn) 編輯本段
性能卓越
截至2025年8月8日,在大模型競(jìng)技場(chǎng)LMArena上,剛剛上線的GPT - 5憑借著極強(qiáng)的性能在所有細(xì)分類(lèi)目中都位列第一。
編碼能力突出
GPT - 5是OpenAI迄今為止最強(qiáng)大的編碼模型,在復(fù)雜的前端生成和大型代碼庫(kù)調(diào)試方面表現(xiàn)突出,能夠僅憑一個(gè)提示就創(chuàng)建美觀響應(yīng)式的網(wǎng)站、應(yīng)用程序App和游戲。早期測(cè)試者注意到其在間距、排版和留白等設(shè)計(jì)選擇方面的改進(jìn)。在從GitHub獲取現(xiàn)實(shí)世界編碼任務(wù)的基準(zhǔn)測(cè)試SWE - bench Verified中,GPT - 5思考后首次嘗試的準(zhǔn)確率達(dá)74.9%,高于OpenAI推理模型o3的69.1%和GPT - 4o的30.8%。例如,OpenAI的研究者演示要求GPT - 5創(chuàng)建一款網(wǎng)頁(yè)App,幫助說(shuō)英語(yǔ)的用戶學(xué)習(xí)法語(yǔ),且該App必須有一個(gè)引人入勝的主題,包含抽認(rèn)卡、測(cè)驗(yàn)、經(jīng)典的貪吃蛇游戲,以及追蹤每日學(xué)習(xí)進(jìn)度的方法。研究者將相同的提示詞提交到兩個(gè)GPT - 5窗口中,幾分鐘后生成了兩個(gè)不同的App,雖然OpenAI的負(fù)責(zé)人稱這些App“存在一些缺陷”,但用戶可以根據(jù)個(gè)人喜好再調(diào)整AI生成的軟件,如更改背景或添加更多標(biāo)簽頁(yè)。
幻覺(jué)大幅降低
GPT - 5的“幻覺(jué)”問(wèn)題大幅改善,在HealthBench Hard Hallucinations測(cè)試中錯(cuò)誤信息率僅為1.6%,遠(yuǎn)低于GPT - 4o的15.8%。OpenAI為GPT - 5引入了新的安全訓(xùn)練模式“安全補(bǔ)全”,旨在讓模型在安全范圍內(nèi)提供最有幫助的答案。與GPT - 4o相比,GPT - 5的事實(shí)錯(cuò)誤率降低了45%;在深度思考模式下,事實(shí)錯(cuò)誤率更是比o3大幅下降80%,變得更加準(zhǔn)確可靠。在開(kāi)放性事實(shí)準(zhǔn)確性基準(zhǔn)LongFact和FActScore測(cè)試中,GPT - 5的幻覺(jué)率比o3減少大約六倍,長(zhǎng)篇內(nèi)容生成的準(zhǔn)確性顯著提升。
創(chuàng)意寫(xiě)作出色
GPT - 5能夠處理結(jié)構(gòu)復(fù)雜的寫(xiě)作任務(wù),如無(wú)韻律的抑揚(yáng)格五音步詩(shī)或自然流動(dòng)的自由詩(shī),猶如詩(shī)人。OpenAI的ChatGPT業(yè)務(wù)副總Nick Turley表示,GPT - 5在創(chuàng)意任務(wù)上表現(xiàn)出“更好的品味”,響應(yīng)更自然。
健康咨詢實(shí)用
GPT - 5能更積極地標(biāo)記潛在健康問(wèn)題,幫助用戶解析醫(yī)療結(jié)果,但OpenAI強(qiáng)調(diào),ChatGPT不能替代醫(yī)療專業(yè)人員。在名為HealthBench Hard Hallucinations的測(cè)試中,具備思考能力的GPT - 5出現(xiàn)幻覺(jué)的錯(cuò)誤信息率僅為1.6%,遠(yuǎn)低于GPT - 4o和o3模型,后兩者的錯(cuò)誤信息率分別為15.8%和12.9%。
記憶功能增強(qiáng)
ChatGPT的記憶(Memory)功能現(xiàn)在支持Pro、Plus以及Teams訂閱用戶連接ChatGPT至谷歌賬號(hào),訪問(wèn)日歷內(nèi)容。這意味著ChatGPT可以聯(lián)動(dòng)Gmail和Google Calendar,從而讓GPT - 5根據(jù)用戶日常行程,獲取更多情境能力。ChatGPT甚至可以提醒用戶回復(fù)其收到的電子郵件,閱讀但尚未回復(fù)的電子郵件。這一功能將首先向Pro用戶推出,后續(xù)擴(kuò)展到Plus和Teams訂閱用戶。
安全補(bǔ)全機(jī)制
GPT - 5引入了一種新的安全訓(xùn)練形式,名為安全補(bǔ)全(safe completions),它教模型在安全范圍內(nèi)盡可能給出最有幫助的答案。有時(shí),這可能意味著部分回答用戶的問(wèn)題,或者只提供高水平的回答。如果需要拒絕,經(jīng)過(guò)訓(xùn)練的GPT - 5會(huì)以透明的方式告知用戶拒絕的原因,并提供安全的替代方案。在受控的實(shí)驗(yàn)和OpenAI的生產(chǎn)模型中,OpenAI都發(fā)現(xiàn)這種安全補(bǔ)全的方法更加細(xì)致入微,能夠更好地引導(dǎo)雙重用途問(wèn)題,增強(qiáng)對(duì)模糊意圖的魯棒性,并減少不必要的過(guò)度拒絕。
預(yù)設(shè)性格功能
OpenAI為所有ChatGPT用戶推出四種預(yù)設(shè)性格的全新研究預(yù)覽版。初始的四種性格選項(xiàng)——憤世嫉俗者(Cynic)、機(jī)器人(Robot)、傾聽(tīng)者(Listener)和書(shū)呆子(Nerd)都是可選的,用戶可在設(shè)置中隨時(shí)調(diào)整,用以匹配ChatGPT和用戶的溝通風(fēng)格。上述四種性格最初適用于文本聊天,之后將擴(kuò)展到語(yǔ)音聊天,讓用戶無(wú)需編寫(xiě)自定義提示詞即可設(shè)置ChatGPT的交互方式,無(wú)論是簡(jiǎn)潔專業(yè)的、周到支持的,還是略帶諷刺的。
社會(huì)評(píng)價(jià) 編輯本段
薩姆·奧爾特曼在發(fā)布會(huì)上稱,如果說(shuō)GPT - 4是一個(gè)大學(xué)生,那么GPT - 5就是“真正的專家”。
相關(guān)事件 編輯本段
撤銷(xiāo)權(quán)限風(fēng)波
2025年8月1日,《連線》發(fā)布博文稱在OpenAI發(fā)布GPT - 5模型之際,Anthropic公司稱OpenAI違反了服務(wù)條款,撤銷(xiāo)了OpenAI對(duì)其模型的API訪問(wèn)權(quán)限。根據(jù)Anthropic的商業(yè)服務(wù)條款,客戶禁止使用該服務(wù)“構(gòu)建競(jìng)爭(zhēng)性產(chǎn)品或服務(wù),包括訓(xùn)練競(jìng)爭(zhēng)性AI模型”或“逆向工程或復(fù)制”服務(wù)。此次撤銷(xiāo)OpenAI對(duì)Claude的訪問(wèn)權(quán)限,正值其準(zhǔn)備發(fā)布新AI模型GPT - 5,有消息稱該模型在編程方面表現(xiàn)更佳。
發(fā)布會(huì)現(xiàn)場(chǎng)BUG事件
在GPT - 5的發(fā)布會(huì)上,直播中展示的性能圖表存在數(shù)據(jù)與圖表顯示不匹配的情況,例如在編程基準(zhǔn)測(cè)試(swe - bench)的圖表中,GPT - 5的準(zhǔn)確率標(biāo)注為52.8%,但對(duì)應(yīng)的柱狀圖高度卻超過(guò)了標(biāo)注為69.1%的舊模型O3的柱狀圖,引發(fā)了網(wǎng)友的廣泛質(zhì)疑。關(guān)于減少幻覺(jué)方面的demo,也被人挑出了毛病,奧爾特曼也承認(rèn)了錯(cuò)誤。同時(shí),馬斯克轉(zhuǎn)發(fā)了GPT - 5在ARC - AGI - 2上沒(méi)有打敗Grok 4的消息。
連破“百年懸案”
2025年10月,兩位研究人員僅用一個(gè)周末,便借助GPT - 5解決了10個(gè)「百年懸案」級(jí)的埃爾德什難題。正如數(shù)學(xué)家陶哲軒所言,AI最有成效的應(yīng)用是處理查文獻(xiàn)等耗時(shí)環(huán)節(jié),將研究者解放出來(lái)專注于思考。這標(biāo)志著一種科研范式的到來(lái),AI正成為重塑基礎(chǔ)科學(xué)、加速人類(lèi)接近真理的工具。
附件列表
詞條內(nèi)容僅供參考,如果您需要解決具體問(wèn)題
(尤其在法律、醫(yī)學(xué)等領(lǐng)域),建議您咨詢相關(guān)領(lǐng)域?qū)I(yè)人士。
如果您認(rèn)為本詞條還有待完善,請(qǐng) 編輯
