DeepSeek贏麻了,首個推理模型就超越OpenAI o1
Napoleon Chan / 2024-11-21 17:5491867今年早些時候,國內科技公司DeepSeek(深度求索)因V2模型一舉成名,成名的原因簡單粗暴,主打高性價比。在當時,DeepSeek V2的API定價約等于谷歌的七分之一,GPT-4 Turbo的七十分之一。
時隔幾個月,這家被業界冠以“AI界拼多多”之稱的公司,迅速推出首個推理模型「DeepSeek-R1預覽版」。該模型一經推出,便在AIME以及全球頂級編程競賽(codeforces)等權威評測中,大幅超越了GPT4o,甚至o1-preview,一夜之間轟動全球。

時間倒退回今年5月前后,在大模型領域,國內各大廠牌內卷最兇猛,創立于2023年4月的DeepSeek一戰成名,毫無疑問是當時的“黑馬”。但是,人們提起DeepSeek總是帶著“高性價比”的標簽,不自覺讓大家忽視他們強大的技術力。
如今,推理模型DeepSeek-R1預覽版在AIME和MATH這兩個關鍵基準測試上超越了OpenAI o1,大家終于不只以“性價比”來衡量DeepSeek。

這里簡單解釋一下,AIME在美國數學競賽(AMC)中難度等級最高,所以常被用來測試不同模型解決推理問題的性能。DeepSeek-R1預覽版在解決這些復雜數學問題時擁有極強的“拆解能力”,能夠將復雜任務分解為更小的步驟并逐一執行,從而提高其準確性。
同時,DeepSeek-R1預覽版的思維過程是完全透明的,允許用戶驗證不同階段得出的答案。

值得注意的是,DeepSeek-R1預覽版與OpenAI o1模型類似,會根據問題的復雜度,在回答前“思考”一會兒,有時甚至長達數十秒。
就在該預覽版發布后不久,DeepSeek便表示計劃開源DeepSeek-R1并發布API,果然,這就是開源精神。在中國所有大模型創業公司中,DeepSeek是為數不多未做to C應用的公司,而且堅持開源,深受社區歡迎。

此次一戰成名,全世界不少人對DeepSeek這家中國公司產生興趣。雖然DeepSeek是打響“價格戰”后讓大家熟知,但深入了解后發現,DeepSeek不僅沒有燒錢補貼,甚至有利潤。
在DeepSeek-R1預覽版后,低調的“技術大牛”形象深入人心,讓我們更加期待DeepSeek(深度求索)未來繼續帶來更多驚艷的AI模型。
DeepSeek贏麻了,首個推理模型就超越OpenAI o1














滬公網安備 31010702005758號
發表評論注冊|登錄