在頻頻“跳票”和多次“劇透”之后,萬眾期待的GPT-5終于發布了。
北京時間8月8日凌晨1時,OpenAI舉行了長達1個多小時的線上發布會,正式推出了GPT-5。與此前的模型更新直播時間短且主要由研發人員發布相比,GPT-5的發布明顯規格更高,不僅發布時間長、細節多,而且OpenAI首席執行官山姆·奧特曼也現身發布會現場。
經證券時報記者梳理,發布會的主要亮點如下:
集成模型:GPT-5是一個集成模型(integrated model),融合了大語言模型GPT系列和推理模型o系列,這意味著用戶在使用時不再需要手動切換各類不同的模型。
能力提升:據OpenAI公開的測試數據,GPT-5在數學、編程、視覺感知和健康等領域,都表現出了頂尖性能,全部大幅度超越前代,成為目前最強大模型。
幻覺降低:與GPT-4o相比,GPT-5的事實錯誤率降低了45%;深度思考模式下,事實錯誤率則比o3降低80%,變得更加準確和可靠。
“專家級別”的大模型,智能且融合水平高
在發布會上,奧特曼對GPT-5給出了極高評價,稱其是“此前所有模型的巨大飛躍”。他還表示,如果說GPT-4是一個大學生,那么GPT-5就是“真正的專家”。
GPT-5最核心的亮點是,它并非單一的語言或者推理模型,而是整合了GPT系列(大語言模型)和o系列(推理模型),具備調度子模型的能力。奧特曼在其個人社交平臺上連發十余條推文介紹GPT-5,其中首條就強調“GPT-5是一個集成模型,這意味著不再需要模型切換器,它將自行決定何時需要更深入地思考”。
據介紹,GPT-5首次使用了內嵌式三位一體集成架構,系統由三部分組成,分別是處理常規問題的GPT-5-main模型、解決復雜任務的GPT-5-thinking 深度思考模型、以及實時決策的路由機制,還有一個是額度使用完后啟動的mini版本。其中,實時決策的路由機制會根據對話類型、復雜程度、工具需求以及用戶的明確意圖,快速決定使用哪個模型,自主決定是否進入深度思考模式,自動匹配最適合的模型。
根據OpenAI公開的測試數據,GPT-5在數學、編程、視覺感知和健康領域表現均大幅超越前代模型,展現了頂尖的性能。例如在數學領域,GPT-5在2025年AIME測試中無工具輔助達到94.6%,大幅超過了o3模型;在健康領域,GPT-5的表現大幅超越包括GPT-4o、o1、o3和o4-mini在內的所有前代模型。
值得注意的是,在大模型競技場LMArena上,剛剛上線的GPT-5憑借著極強的性能在所有細分類目中都位列第一。
應用場景方面,據現場展示的多個案例,GPT-5編碼能力突出,只需要幾句話就可以創建一個名為“Jumping Ball Runner”的游戲。該游戲界面色彩豐富,游戲角色采用卡通風格設計,且具備最高分記錄功能、重試按鈕、趣味音效等多種特色功能。此外,GPT-5還可以用幾分鐘就開發一個學習法語的網絡應用、一個復雜的財務分析模版等等。
作為長期被用戶吐槽的重災區,“AI幻覺”一直是所有大模型難以克服的痛點。GPT在減少AI幻覺方面,展現了行業領先的水平。據介紹,與GPT-4o相比,GPT-5的事實錯誤率降低了45%;在深度思考模式下,事實錯誤率更是比o3大幅下降80%,變得更加準確可靠。在開放性事實準確性基準LongFact和FActScore測試中,GPT-5的幻覺率比o3減少大約六倍,長篇內容生成的準確性顯著提升。
GPT-5擁有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四個版本,免費用戶的GPT-5用量有限,超過限額后將自動轉至GPT-5-mini,GPT-5-pro僅供Pro訂閱用戶使用。
定價方面,GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向開發者提供API服務,三款模型的輸入、輸出價格分別為每百萬token 1.25美元/10美元、每百萬token 0.5美元/5美元、每百萬token 0.15美元/1.5美元。與主要競爭對手Anthropic和谷歌相比,OpenAI的GPT-5模型對于開發人員來說成本相當甚至更低。
此前差點“難產”,被質疑進步不夠驚艷
GPT-5一直是OpenAI最受外界關注和期待的產品。但在過去的一年多時間里,盡管頻頻有GPT-5即將發布的消息傳出,但也屢屢“跳票”,始終未能如約而至。
在此期間,OpenAI發布了許多復雜的模型產品與功能更新。總體來看,OpenAI模型有GPT(大語言模型)和o(推理模型)兩大核心系列,同時還通過Turbo、mini、high等后綴或內部代號來區分模型的版本與特性。據統計,OpenAI對外提供服務的模型數量已超過了40個,尺寸、上下文窗口、價格各異。大量的模型讓用戶面臨“選擇困難癥“。
在今年6月的一場播客節目中,奧特曼也提到,產品發布節奏失控是復雜化的主因,他表示希望未來不會出現更復雜的命名方式,盡快走出當前o4-mini、o3、4o等略顯混亂的命名局面。“我期待著GPT-5和GPT-6的到來,這樣人們使用起來會更簡單,不用再糾結于o4-mini-high或o3這樣的版本。”奧特曼說。
之所以衍生出這么多模型產品并且再三推遲GPT-5的發布時間,原因是GPT-5的研發一直不順利,沒有達到期待。縱觀OpenAI在推出GPT-4以后的大多數模型,都屬于"漸進式優化",沒有復刻像GPT-4那樣巨大的性能飛躍。
值得注意的是,在GPT-5發布前夕,多個信源爆料稱,GPT-5并未取得明顯技術突破,依然沒有像GPT-4那種級別的進步。此外,由于Meta前段時間瘋狂“挖人”,一大批核心研究者被高薪挖走,導致內部組織結構陷入混亂,讓GPT-5的研發進一步陷入困境。據知情人士爆料,直到今年6月,OpenAI開發的模型中沒有一個能配得上GPT-5的名號,內部也無法確認哪個模型版本足以稱之為GPT-5。
一名人工智能資深研究員告訴證券時報記者,雖然GPT-5 在編程、數學推理、智能體等方面表現有所進步,但仍然只是“漸進式優化”,而非顛覆性、跨越式的提升。GPT-5表現不夠驚艷的核心原因在于,大模型訓練遵循Scaling Laws(縮放定律),即模型性能隨著參數規模、訓練數據量、計算資源的增加而提升。如今這一定律正在放緩,預訓練帶來的邊際收益在減弱,而且全球高質量數據已經枯竭,這也使得OpenAI的訓練資源面臨瓶頸,模型性能提升十分有限。
正以5000億美元估值進行員工股份出售
此次推出GPT-5,除了回應市場長期以來的期待,或許還與OpenAI近期正在進行的資本運作有關。據外媒8月6日報道,知情人士透露,OpenAI正以約5000億美元的估值對現任和前任員工潛在的股票二次出售展開初步談判。
值得注意的是,就在一周以前,OpenAI才成功融資83億美元,投資者包括黑石集團、TPG、T.Rowe等,估值達到3000億美元。若股票二次出售的交易成功,OpenAI的賬面估值將較此前估值增長約三分之二,并將一舉超越SpaceX,成為全球最具價值的獨角獸。
GPT-5的發布,將進一步鞏固OpenAI在大模型技術領域的領先優勢,提振投資者信心,有助于公司估值的增長及股票二次出售計劃的實施。
業內人士分析,最近一段時間,硅谷的“搶人大戰”趨于白熱化,OpenAI多名核心研發人員的離職給公司帶來重創。OpenAI此舉旨在為員工提供兌現機會,同時作為人才激勵工具,在不稀釋公司控制權的情況下,增強員工忠誠度。
除此以外,為了增強對人才的吸引力,Hyperbolic AI首席執行官Yuchen Jin在社交平臺上表示,他在OpenAI任職的朋友透露,奧特曼近日宣布將在兩年內為每名員工提供150萬美元獎金。
校對:彭其華