伊隆馬斯克透露:AI訓練資料有耗盡的風險,後果是什麼?


在上週與Stagwell 總裁馬克·佩恩(Mark Penn) 的即時聊天中,埃隆·馬斯克(Elon Musk) 明確表示,人工智慧(AI) 行業正面臨著訓練用戶人工智慧模型的真實數據短缺的問題。馬斯克表示,傳統的人工智慧訓練方法不再有效,建議改用合成資料。

馬斯克表示,合成資料的使用是AI產業的一個新方向,其中資料是由AI模型本身產生的。他相信這將有助於人工智慧評估自身並從學習過程中學習。 Microsoft、Meta、OpenAI 和 Anthropic 等大型科技公司現在正在使用合成資料來訓練領先的人工智慧模型。

然而,使用聚合資料也會帶來許多風險,例如使模型的創造性較差且輸出存在偏差。伊隆馬斯克警告說,AI訓練中的資料耗盡不僅是當前的問題,而且還會影響AI產業的未來。如果無法及時解決數據短缺問題,可能會威脅到人工智慧及其現實應用的發展。

在上週與 Stagwell 總裁 Mark Penn 的即時聊天中, 馬斯克 業內人士表示 人工智慧WHO)面臨一個嚴重的問題:訓練AI模型的真實資料幾乎耗盡。馬斯克表示,從現在開始,傳統方法 人工智慧培訓 將不再有效,產業需要轉向更新的解決方案,例如製定自己的解決方案 匯總數據

馬斯克強調,在訓練人工智慧方面,我們“幾乎耗盡了人類的全部知識”,他將此歸因於去年發生的事情。 OpenAI 前首席科學官 Ilya Sutskever 在 NeurIPS 會議上的演講中強化了這一觀察,他表示 AI 行業已經達到了「數據高峰」。蘇茨克維爾也這麼做了 警告 訓練資料的短缺將需要改變模型的開發方式。

馬斯克表示,該產業可能的方向之一是合成資料的生產,也就是AI模型本身產生的資料。他解釋說,“補充真實數據的唯一方法是使用合成數據,其中人工智慧產生訓練數據。”他相信,借助聚合數據,人工智慧將能夠獨立完成任務 評價 並從自己的學習過程中學習。

Microsoft、Meta、OpenAI 和 Anthropic 等許多大型科技公司已經在使用合成資料來訓練領先的人工智慧模型。 Gartner 的一項研究表明,到 2024 年,用於人工智慧和分析專案的大約 60% 的數據將被匯總。

通常,微軟在本週早些時候開放了 Phi-4 模型的源代碼,該模型是根據真實數據和合成數據進行訓練的。同樣,Google的 Gemma 模型也使用聚合資料。 Anthropic 也應用了一些合成資料來開發其 Claude 3.5 Sonnet 系統。 Meta 也利用人工智慧產生的數據改進了最新系列的 Llama 模型。

使用聚合資料不僅有助於克服資料短缺,而且還提供成本優勢。新創人工智慧作家說巴爾米拉

然而,使用匯總資料也帶來許多風險。一些研究表明,聚合數據可能會導致模型退化,模型變得不那麼“有創意”,並且其輸出更加偏向,這最終會嚴重降低其運行能力。如果用於訓練這些模型的資料有偏差和局限性,那麼人工智慧產品也會有這些缺點。

畢竟,馬斯克談論人工智慧訓練中的資料耗盡不僅是對當前情況的訊號,也是對這個產業未來的警告。如果沒有及時調整,真實數據的缺乏可能會擾亂人工智慧及其現實應用的發展。

< div 類別=”泰語”>

< h1>結論 Elon Musk 認為真正的 AI 訓練資料已經耗盡,使用合成資料是 AI 產業的新方向。這不僅有助於克服數據短缺,而且還提供了成本效益。然而,使用合成數據也帶來許多風險,如果沒有及時調整,真實數據的缺乏可能會影響人工智慧未來的發展。
查看詳情並註冊


Source link


探索更多來自 Gizmo Review 的內容

訂閱後即可透過電子郵件收到最新文章。

發表回覆

探索更多來自 Gizmo Review 的內容

立即訂閱即可持續閱讀,還能取得所有封存文章。

Continue reading