阿里巴巴剛剛在農曆新年的第一天推出了2.5-Max Qwen AI車型,宣布超過DeepSeek-V3和GPT-4O。此舉顯示了中國技術公司激烈的競爭。 #alibaba #ai#deepseek-v3#gpt-4o#qwen2.5max #tet假期
阿里巴巴剛剛在《農曆新年》(1月29日)的第一天宣布了AI 2.5-Max AI模型,這是重要通知的罕見時間。此舉反映了DeepSeek的競爭壓力日益增長,中國AI創業公司以廉價的培訓成本和令人印象深刻的表現震驚了市場。
根據阿里巴巴雲(Alibaba Cloud)的說法,阿里巴巴的雲計算單元,QWEN 2.5-MAX優於GPT-4O(OpenAI),DeepSeek-V3和Llama-3.1-405b(Meta)。這些是當今最先進的AI模型。
DeepSeek在啟動DeepSeek-V3(1月10日)和DeepSeek-R1(1月20日)時已成為技術界最受歡迎的名稱。僅幾天后,DeepSeek-R1上升到美國Apple App Store上AI應用程序排名的頂部,超過了Openai的產品。
由於開發成本較低,DeepSeek使用適度的性能硬件,挑戰了數十億美元的OpenAI,Meta,Anthropic的支出策略。許多投資者擔心,DeepSeek的廉價AI模型會震撼美國技術巨頭的統治地位。
值得注意的是,在第三方測試中,DeepSeek-R1的評分優於OpenAI,Meta和人類的AI模型。這引起了矽谷的擔憂,即中國在AI比賽中可能超過美國。
不僅向美國公司施加壓力,DeepSeek的成功還使國內競爭對手急劇升級了AI模型。 DeepSeek-R1推出後僅兩天,Bytedance(Tiktok的母公司)已更新了其最高的AI型號,並宣布其在AIM測試中超過OpenAI O1 – 評估了理解和反擊提高其複雜準則的能力。
早些時候,2024年5月,DeepSeek-V2在中國激發了AI的戰鬥,每百萬個令牌僅以1元(0.14美元)的釋放。這導致阿里巴巴削減了一系列AI模型的97%。其他巨頭等貝杜(Baidu),騰訊也很快進入了。
DeepSeek的神秘創始人Liang Wenfeng遇到了廉價的AI競賽,他肯定該公司並沒有大量承擔成本,而是專注於更高的目標-AGI(通用人工智能)。 Liang認為,大型技術公司受到高昂的成本和龐大的組織結構的約束,而DeepSeek則經營著靈活的,主要是招募畢業生和博士學位的學生。
Liang說:“大型AI模型需要連續創新,但大型技術公司受其笨重的管理機構的限制。”
DeepSeek的快速崛起引起了微軟和美國政府的關注。根據彭博社的說法,微軟正在研究DeepSeek是否非法從OpenAI的API收集數據。微軟在Openai投資130億美元的投資中表示,一群涉嫌與DeepSeek相關的個人正在通過OpenAI的API收集大量的AI數據。白宮還聲稱正在考慮與Deepsek有關的國家安全威脅。
David Sacks(白宮官員AI)在Fox News上說,DeepSeek可能已經使用了“蒸餾”技術 – 一種學習機器的方法,可以幫助AI模型從其他模型中學習。面對這些指控,DeepSeek尚未做出正式反饋。
前總統唐納德·特朗普(Donald Trump)回應了Deepseek的興起: “這家中國公司發布的AI DeepSeek是美國行業的喚醒場景。我們需要專注於競爭。” 他還說,如果中國能夠更快,更便宜的人發展,美國就會這樣做。
Source link
探索更多來自 Gizmo Review 的內容
訂閱後即可透過電子郵件收到最新文章。