OpenAI重磅發布GPT-5!性能大幅提升至“專家級別”
    來源:證券時報網作者:周春媚2025-08-08 18:35

    在頻頻“跳票”和多次“劇透”之后,萬眾期待的GPT-5終于發布了。

    北京時間8月8日凌晨1時,OpenAI舉行了長達1個多小時的線上發布會,正式推出了GPT-5。與此前的模型更新直播時間短且主要由研發人員發布相比,GPT-5的發布明顯規格更高,不僅發布時間長、細節多,而且OpenAI首席執行官山姆·奧特曼也現身發布會現場。

    263f9e75eede68f33cf60ceddbe98ace.jpg

    經證券時報記者梳理,發布會的主要亮點如下:

    集成模型:GPT-5是一個集成模型(integrated model),融合了大語言模型GPT系列和推理模型o系列,這意味著用戶在使用時不再需要手動切換各類不同的模型。

    能力提升:據OpenAI公開的測試數據,GPT-5在數學、編程、視覺感知和健康等領域,都表現出了頂尖性能,全部大幅度超越前代,成為目前最強大模型。

    幻覺降低:與GPT-4o相比,GPT-5的事實錯誤率降低了45%;深度思考模式下,事實錯誤率則比o3降低80%,變得更加準確和可靠。

    “專家級別”的大模型,智能且融合水平高

    在發布會上,奧特曼對GPT-5給出了極高評價,稱其是“此前所有模型的巨大飛躍”。他還表示,如果說GPT-4是一個大學生,那么GPT-5就是“真正的專家”。

    GPT-5最核心的亮點是,它并非單一的語言或者推理模型,而是整合了GPT系列(大語言模型)和o系列(推理模型),具備調度子模型的能力。奧特曼在其個人社交平臺上連發十余條推文介紹GPT-5,其中首條就強調“GPT-5是一個集成模型,這意味著不再需要模型切換器,它將自行決定何時需要更深入地思考”。

    42f43d8b3315f5d40f352833469b4170.jpg

    據介紹,GPT-5首次使用了內嵌式三位一體集成架構,系統由三部分組成,分別是處理常規問題的GPT-5-main模型、解決復雜任務的GPT-5-thinking 深度思考模型、以及實時決策的路由機制,還有一個是額度使用完后啟動的mini版本。其中,實時決策的路由機制會根據對話類型、復雜程度、工具需求以及用戶的明確意圖,快速決定使用哪個模型,自主決定是否進入深度思考模式,自動匹配最適合的模型。

    根據OpenAI公開的測試數據,GPT-5在數學、編程、視覺感知和健康領域表現均大幅超越前代模型,展現了頂尖的性能。例如在數學領域,GPT-5在2025年AIME測試中無工具輔助達到94.6%,大幅超過了o3模型;在健康領域,GPT-5的表現大幅超越包括GPT-4o、o1、o3和o4-mini在內的所有前代模型。

    值得注意的是,在大模型競技場LMArena上,剛剛上線的GPT-5憑借著極強的性能在所有細分類目中都位列第一。

    45aa6f64d757c10836b98e2edbc9372b.png

    應用場景方面,據現場展示的多個案例,GPT-5編碼能力突出,只需要幾句話就可以創建一個名為“Jumping Ball Runner”的游戲。該游戲界面色彩豐富,游戲角色采用卡通風格設計,且具備最高分記錄功能、重試按鈕、趣味音效等多種特色功能。此外,GPT-5還可以用幾分鐘就開發一個學習法語的網絡應用、一個復雜的財務分析模版等等。

    3e0233314bf90a4bf301abfbb3c09f3c.png

    作為長期被用戶吐槽的重災區,“AI幻覺”一直是所有大模型難以克服的痛點。GPT在減少AI幻覺方面,展現了行業領先的水平。據介紹,與GPT-4o相比,GPT-5的事實錯誤率降低了45%;在深度思考模式下,事實錯誤率更是比o3大幅下降80%,變得更加準確可靠。在開放性事實準確性基準LongFact和FActScore測試中,GPT-5的幻覺率比o3減少大約六倍,長篇內容生成的準確性顯著提升。

    GPT-5擁有GPT-5、GPT-5-mini、GPT-5-nano和GPT-5-pro四個版本,免費用戶的GPT-5用量有限,超過限額后將自動轉至GPT-5-mini,GPT-5-pro僅供Pro訂閱用戶使用。

    定價方面,GPT-5、GPT-5-mini、GPT-5-nano三款模型可面向開發者提供API服務,三款模型的輸入、輸出價格分別為每百萬token 1.25美元/10美元、每百萬token 0.5美元/5美元、每百萬token 0.15美元/1.5美元。與主要競爭對手Anthropic和谷歌相比,OpenAI的GPT-5模型對于開發人員來說成本相當甚至更低。

    此前差點“難產”,被質疑進步不夠驚艷

    GPT-5一直是OpenAI最受外界關注和期待的產品。但在過去的一年多時間里,盡管頻頻有GPT-5即將發布的消息傳出,但也屢屢“跳票”,始終未能如約而至。

    在此期間,OpenAI發布了許多復雜的模型產品與功能更新。總體來看,OpenAI模型有GPT(大語言模型)和o(推理模型)兩大核心系列,同時還通過Turbo、mini、high等后綴或內部代號來區分模型的版本與特性。據統計,OpenAI對外提供服務的模型數量已超過了40個,尺寸、上下文窗口、價格各異。大量的模型讓用戶面臨“選擇困難癥“。

    在今年6月的一場播客節目中,奧特曼也提到,產品發布節奏失控是復雜化的主因,他表示希望未來不會出現更復雜的命名方式,盡快走出當前o4-mini、o3、4o等略顯混亂的命名局面。“我期待著GPT-5和GPT-6的到來,這樣人們使用起來會更簡單,不用再糾結于o4-mini-high或o3這樣的版本。”奧特曼說。

    之所以衍生出這么多模型產品并且再三推遲GPT-5的發布時間,原因是GPT-5的研發一直不順利,沒有達到期待。縱觀OpenAI在推出GPT-4以后的大多數模型,都屬于"漸進式優化",沒有復刻像GPT-4那樣巨大的性能飛躍。

    值得注意的是,在GPT-5發布前夕,多個信源爆料稱,GPT-5并未取得明顯技術突破,依然沒有像GPT-4那種級別的進步。此外,由于Meta前段時間瘋狂“挖人”,一大批核心研究者被高薪挖走,導致內部組織結構陷入混亂,讓GPT-5的研發進一步陷入困境。據知情人士爆料,直到今年6月,OpenAI開發的模型中沒有一個能配得上GPT-5的名號,內部也無法確認哪個模型版本足以稱之為GPT-5。

    一名人工智能資深研究員告訴證券時報記者,雖然GPT-5 在編程、數學推理、智能體等方面表現有所進步,但仍然只是“漸進式優化”,而非顛覆性、跨越式的提升。GPT-5表現不夠驚艷的核心原因在于,大模型訓練遵循Scaling Laws(縮放定律),即模型性能隨著參數規模、訓練數據量、計算資源的增加而提升。如今這一定律正在放緩,預訓練帶來的邊際收益在減弱,而且全球高質量數據已經枯竭,這也使得OpenAI的訓練資源面臨瓶頸,模型性能提升十分有限。

    正以5000億美元估值進行員工股份出售

    此次推出GPT-5,除了回應市場長期以來的期待,或許還與OpenAI近期正在進行的資本運作有關。據外媒8月6日報道,知情人士透露,OpenAI正以約5000億美元的估值對現任和前任員工潛在的股票二次出售展開初步談判。

    值得注意的是,就在一周以前,OpenAI才成功融資83億美元,投資者包括黑石集團、TPG、T.Rowe等,估值達到3000億美元。若股票二次出售的交易成功,OpenAI的賬面估值將較此前估值增長約三分之二,并將一舉超越SpaceX,成為全球最具價值的獨角獸。

    GPT-5的發布,將進一步鞏固OpenAI在大模型技術領域的領先優勢,提振投資者信心,有助于公司估值的增長及股票二次出售計劃的實施。

    業內人士分析,最近一段時間,硅谷的“搶人大戰”趨于白熱化,OpenAI多名核心研發人員的離職給公司帶來重創。OpenAI此舉旨在為員工提供兌現機會,同時作為人才激勵工具,在不稀釋公司控制權的情況下,增強員工忠誠度。

    除此以外,為了增強對人才的吸引力,Hyperbolic AI首席執行官Yuchen Jin在社交平臺上表示,他在OpenAI任職的朋友透露,奧特曼近日宣布將在兩年內為每名員工提供150萬美元獎金。

    校對:彭其華

    責任編輯: 高蕊琦
    聲明:證券時報力求信息真實、準確,文章提及內容僅供參考,不構成實質性投資建議,據此操作風險自擔
    下載“證券時報”官方APP,或關注官方微信公眾號,即可隨時了解股市動態,洞察政策信息,把握財富機會。
    網友評論
    登錄后可以發言
    發送
    網友評論僅供其表達個人看法,并不表明證券時報立場
    暫無評論
    為你推薦
    時報熱榜
    換一換
      熱點視頻
      換一換
      主站蜘蛛池模板: 性调教室高h学校小说| 波多野结衣porn| 国产成人综合亚洲一区| canopen永久| 日本欧美成人免费观看| 亚洲欧美另类自拍| 精品国产一区二区| 国产又粗又猛又爽视频| 91最新地址永久入口| 性色AV无码中文AV有码VR| 乱人伦中文字幕在线| 永久在线免费观看港片碟片| 卡通动漫中文字幕第一区| 高潮毛片无遮挡高清免费| 国产精品青草久久| 亚洲高清资源在线观看| 贵妇的脚奴视频vk| 国产精品免费一区二区三区| www亚洲成人| 欧美大片天天免费看视频| 午夜性色吃奶添下面69影院| 黑人大长吊大战中国人妻| 国外欧美一区另类中文字幕| 中文japanese在线播放| 欧美精品久久久久久久影视| 午夜影院app| 韩国爸爸的朋友10整有限中字| 国产精品成人久久久| www.好吊妞| 搡女人免费视频大全| 九九综合九九综合| 欧美激情videos| 免费国产不卡午夜福在线| 色偷偷成人网免费视频男人的天堂| 国产精品亚洲欧美大片在线看| jizz.日本| 欧美不卡一区二区三区| 免费**毛片在线播放视| 老鸭窝在线播放| 国产太嫩了在线观看| 日日夜夜嗷嗷叫|