日韩国产欧美在线更新视频,91欧美激情一区二区三区成人,欧美日本免费一区二区三区

OpenAI重磅發布GPT-5！性能大幅提升至“專家級別”

來源：證券時報網作者：周春媚2025-08-08 18:35

在頻頻“跳票”和多次“劇透”之后，萬眾期待的GPT-5終于發布了。

北京時間8月8日凌晨1時，OpenAI舉行了長達1個多小時的線上發布會，正式推出了GPT-5。與此前的模型更新直播時間短且主要由研發人員發布相比，GPT-5的發布明顯規格更高，不僅發布時間長、細節多，而且OpenAI首席執行官山姆·奧特曼也現身發布會現場。

經證券時報記者梳理，發布會的主要亮點如下：

集成模型：GPT-5是一個集成模型（integrated model），融合了大語言模型GPT系列和推理模型o系列，這意味著用戶在使用時不再需要手動切換各類不同的模型。

能力提升：據OpenAI公開的測試數據，GPT-5在數學、編程、視覺感知和健康等領域，都表現出了頂尖性能，全部大幅度超越前代，成為目前最強大模型。

幻覺降低：與GPT-4o相比，GPT-5的事實錯誤率降低了45%；深度思考模式下，事實錯誤率則比o3降低80%，變得更加準確和可靠。

“專家級別”的大模型，智能且融合水平高

在發布會上，奧特曼對GPT-5給出了極高評價，稱其是“此前所有模型的巨大飛躍”。他還表示，如果說GPT-4是一個大學生，那么GPT-5就是“真正的專家”。

GPT-5最核心的亮點是，它并非單一的語言或者推理模型，而是整合了GPT系列（大語言模型）和o系列（推理模型），具備調度子模型的能力。奧特曼在其個人社交平臺上連發十余條推文介紹GPT-5，其中首條就強調“GPT-5是一個集成模型，這意味著不再需要模型切換器，它將自行決定何時需要更深入地思考”。

據介紹，GPT-5首次使用了內嵌式三位一體集成架構，系統由三部分組成，分別是處理常規問題的GPT-5-main模型、解決復雜任務的GPT-5-thinking 深度思考模型、以及實時決策的路由機制，還有一個是額度使用完后啟動的mini版本。其中，實時決策的路由機制會根據對話類型、復雜程度、工具需求以及用戶的明確意圖，快速決定使用哪個模型，自主決定是否進入深度思考模式，自動匹配最適合的模型。

根據OpenAI公開的測試數據，GPT-5在數學、編程、視覺感知和健康領域表現均大幅超越前代模型，展現了頂尖的性能。例如在數學領域，GPT-5在2025年AIME測試中無工具輔助達到94.6%，大幅超過了o3模型；在健康領域，GPT-5的表現大幅超越包括GPT-4o、o1、o3和o4-mini在內的所有前代模型。

值得注意的是，在大模型競技場LMArena上，剛剛上線的GPT-5憑借著極強的性能在所有細分類目中都位列第一。

應用場景方面，據現場展示的多個案例，GPT-5編碼能力突出，只需要幾句話就可以創建一個名為“Jumping Ball Runner”的游戲。該游戲界面色彩豐富，游戲角色采用卡通風格設計，且具備最高分記錄功能、重試按鈕、趣味音效等多種特色功能。此外，GPT-5還可以用幾分鐘就開發一個學習法語的網絡應用、一個復雜的財務分析模版等等。

作為長期被用戶吐槽的重災區，“AI幻覺”一直是所有大模型難以克服的痛點。GPT在減少AI幻覺方面，展現了行業領先的水平。據介紹，與GPT-4o相比，GPT-5的事實錯誤率降低了45%；在深度思考模式下，事實錯誤率更是比o3大幅下降80%，變得更加準確可靠。在開放性事實準確性基準LongFact和FActScore測試中，GPT-5的幻覺率比o3減少大約六倍，長篇內容生成的準確性顯著提升。

GPT-5擁有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四個版本，免費用戶的GPT-5用量有限，超過限額后將自動轉至GPT-5-mini，GPT-5-pro僅供Pro訂閱用戶使用。

定價方面，GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向開發者提供API服務，三款模型的輸入、輸出價格分別為每百萬token 1.25美元/10美元、每百萬token 0.5美元/5美元、每百萬token 0.15美元/1.5美元。與主要競爭對手Anthropic和谷歌相比，OpenAI的GPT-5模型對于開發人員來說成本相當甚至更低。

此前差點“難產”，被質疑進步不夠驚艷

GPT-5一直是OpenAI最受外界關注和期待的產品。但在過去的一年多時間里，盡管頻頻有GPT-5即將發布的消息傳出，但也屢屢“跳票”，始終未能如約而至。

在此期間，OpenAI發布了許多復雜的模型產品與功能更新。總體來看，OpenAI模型有GPT（大語言模型）和o（推理模型）兩大核心系列，同時還通過Turbo、mini、high等后綴或內部代號來區分模型的版本與特性。據統計，OpenAI對外提供服務的模型數量已超過了40個，尺寸、上下文窗口、價格各異。大量的模型讓用戶面臨“選擇困難癥“。

在今年6月的一場播客節目中，奧特曼也提到，產品發布節奏失控是復雜化的主因，他表示希望未來不會出現更復雜的命名方式，盡快走出當前o4-mini、o3、4o等略顯混亂的命名局面。“我期待著GPT-5和GPT-6的到來，這樣人們使用起來會更簡單，不用再糾結于o4-mini-high或o3這樣的版本。”奧特曼說。

之所以衍生出這么多模型產品并且再三推遲GPT-5的發布時間，原因是GPT-5的研發一直不順利，沒有達到期待。縱觀OpenAI在推出GPT-4以后的大多數模型，都屬于"漸進式優化"，沒有復刻像GPT-4那樣巨大的性能飛躍。

值得注意的是，在GPT-5發布前夕，多個信源爆料稱，GPT-5并未取得明顯技術突破，依然沒有像GPT-4那種級別的進步。此外，由于Meta前段時間瘋狂“挖人”，一大批核心研究者被高薪挖走，導致內部組織結構陷入混亂，讓GPT-5的研發進一步陷入困境。據知情人士爆料，直到今年6月，OpenAI開發的模型中沒有一個能配得上GPT-5的名號，內部也無法確認哪個模型版本足以稱之為GPT-5。

一名人工智能資深研究員告訴證券時報記者，雖然GPT-5 在編程、數學推理、智能體等方面表現有所進步，但仍然只是“漸進式優化”，而非顛覆性、跨越式的提升。GPT-5表現不夠驚艷的核心原因在于，大模型訓練遵循Scaling Laws（縮放定律），即模型性能隨著參數規模、訓練數據量、計算資源的增加而提升。如今這一定律正在放緩，預訓練帶來的邊際收益在減弱，而且全球高質量數據已經枯竭，這也使得OpenAI的訓練資源面臨瓶頸，模型性能提升十分有限。

正以5000億美元估值進行員工股份出售

此次推出GPT-5，除了回應市場長期以來的期待，或許還與OpenAI近期正在進行的資本運作有關。據外媒8月6日報道，知情人士透露，OpenAI正以約5000億美元的估值對現任和前任員工潛在的股票二次出售展開初步談判。

值得注意的是，就在一周以前，OpenAI才成功融資83億美元，投資者包括黑石集團、TPG、T.Rowe等，估值達到3000億美元。若股票二次出售的交易成功，OpenAI的賬面估值將較此前估值增長約三分之二，并將一舉超越SpaceX，成為全球最具價值的獨角獸。

GPT-5的發布，將進一步鞏固OpenAI在大模型技術領域的領先優勢，提振投資者信心，有助于公司估值的增長及股票二次出售計劃的實施。

業內人士分析，最近一段時間，硅谷的“搶人大戰”趨于白熱化，OpenAI多名核心研發人員的離職給公司帶來重創。OpenAI此舉旨在為員工提供兌現機會，同時作為人才激勵工具，在不稀釋公司控制權的情況下，增強員工忠誠度。

除此以外，為了增強對人才的吸引力，Hyperbolic AI首席執行官Yuchen Jin在社交平臺上表示，他在OpenAI任職的朋友透露，奧特曼近日宣布將在兩年內為每名員工提供150萬美元獎金。

校對：彭其華

責任編輯：高蕊琦

OpenAI

GPT-5

大語言模型

聲明：證券時報力求信息真實、準確，文章提及內容僅供參考，不構成實質性投資建議，據此操作風險自擔