Google在 2023 年 12 月推出了 Gemini 的第一個模型,當時他們的聊天機器人仍稱為 Bard。從那時起,這家大型搜尋公司幾乎所有與人工智慧相關的活動都採用了 Gemini 名稱。
今年早些時候,聊天機器人 Bard 更名為 Gemini。緊隨其後的是 Gemini Assistant,它取代了 Android 上以前的助理。該公司還在文件和開發人員中使用 Gemini。
在最初的活動爆發之後,谷歌的發展速度似乎已經放緩。該公司沒有像以前那樣使用新名稱,而是專注於 Gemini,並將其添加到越來越多的產品和服務中。
隨後,12 月,Google 發布了 Gemini 2.0。執行長 Sundar Pichai 將此次發布描述為 Agency 時代的開始。這是人工智慧模型根據一組初始指令為您執行任務的地方。
#GoogleGemini #ArtificialIntelligenceGemini #GoogleAIGemini #Gemini2.0 #GeminiAssistant
來源: https://manualmentor.com/google-gemini-everything-you-need-to-know.html?utm_source=rss&utm_medium=rss&utm_campaign=google-gemini-everything-you-need-to-know
Google 推出了第一個 雙子座 2023 年 12 月推出模型,當時其聊天機器人仍名為 Bard。從那時起,這家搜尋巨頭幾乎所有與人工智慧相關的事情都逐漸採用了 Gemini 這個名字。
Bard 聊天機器人是第一個倒下的機器人,今年稍早更名為 Gemini。緊隨其後的是 雙子座助理 很大程度上取代了Android上以前的助手。該公司還在文件和開發人員中使用 Gemini。
在最初的一系列活動之後,谷歌的進展似乎放緩了。該公司沒有像以前那樣使用新名稱,而是加倍努力,將 Gemini 添加到更多的產品和服務中。然後,到了十二月 谷歌發布Gemini 2.0。執行長 Sundar Pichai 將其發布描述為特工時代的開始。這是人工智慧模型根據一組初始指令代表您執行任務的地方。
什麼是雙子座?
雙子座 2.0 簡介 |我們迄今為止最強大的人工智慧模型 – YouTube
Gemini 模型不僅接受過文字訓練,而且還作為一種多模態模型進行訓練,可以處理圖像、視訊、音訊甚至電腦程式碼。這類似於 開放人工智慧的 GPT-4o,從 Gemini 2 開始,它也可以輸出這些方法。
與Google的典型營運模式一致,該模型的最新版本在過去幾個月中悄悄開發,並提供了一些諸如 ChatGPT 等大肆宣傳的產品所忽略的功能。
例如,Hugging Face 上的 Gemini 現在有超過 50,000 個變體,涵蓋多種語言和用途。
不幸的是,這種多樣性已經產生了相當大的混亂。最新的 Gemini 發射讓事情變得更糟,因此我們認為是時候繪製出 Gemini 宇宙的清晰地圖,以使事情更容易理解。
首先要意識到的是,谷歌喜歡將模型技術和應用程式與同名的變體混合搭配。一旦你弄清楚了這一點,其他一切就開始就位。
1. 型號
最開始的是2010年在倫敦成立的人工智慧實驗室DeepMind。雙子座是這一代家族的最新成員。
Gemini 型號的 1.0 版本推出了 Ultra、Pro 和 Nano 三種版本。顧名思義,這些型號的範圍從高功率版本到設計用於在手機和其他小型設備上運行的小型版本。
請注意,後續發布的大部分混亂都是由於谷歌搜尋和人工智慧業務之間的哲學鬥爭而造成的。
人工智慧對搜尋的蠶食一直是懸在該公司頭上的一把劍,並極大地促成了該公司在發佈人工智慧產品時「會、不會」的態度。
Gemini 1.5 於十個月前發布,是對原始模型的增量改進,融合了專家混合 (MoE) 技術、一百萬個代幣上下文視窗和新架構。從那時起,我們就看到了 Gemini 1.5 Flash、Gemini 1.5 Pro-002 和 Gemini 1.5 Flash-002 的發布——後者僅在三個月前發布。
同時,該公司也出乎意料地進軍開放模型領域,推出了免費的 Gemma 產品。這些 2B 和 7B 參數模型被視為對 元推出 Llama 模型系列。五個月後,Gemma 2.0 發布。
Gemini 2.0於2024年12月推出,被譽為代理商時代的典範。第一個發布的版本是Gemini 2.0 Flash Experimental,這是一個高效能的多模式模型,支援Google搜尋等工具的使用,以及程式碼產生的函數呼叫。
幾週內,該公司推出了 Gemini 2.0 Experimental Advanced,顯然是當前世代的完整版本。我們說顯然是因為此時沒有人真正確定什麼是完整的以及什麼是早期程式碼。
可以肯定地說,Gemini 2.0 Flash Experimental 是一個功能極其強大、性能全面的 AI 模型。
雙子座車型
- Gemini 1 Ultra – 強大
- Gemini 1 Pro – 中檔
- Gemini 1 Nano – 小
- Gemini 1.5 Flash – 快速、便宜
- Gemini 1.5 Pro – 較慢、較貴
- Gemini 2.0 Flash實驗
- 雙子座2.0閃思維
- Gemini 2.0 實驗高級版
傑瑪模型(Gemmaverse)
- Gemma 1(2B、7B 參數)
- Gemma 2(2B、9B、27B):從頭開始訓練的 27B。
- CodeGemma(2B 和 7B):針對程式碼產生進行了微調。
- RecurrentGemma (2B, 9B):基於 Griffin,而非基於 Transformer。
- PaliGemma 2(3B、10B、28B):視覺模型接受文字和圖像輸入。多種語言。
- DataGemma:以資料為中心的模型
- GemmaScope:人工智慧研究工具
2. 應用
谷歌既是研究公司,也是產品公司。 DeepMind 和 Google AI 領導了這項研究並發布了模型。谷歌的另一邊則採用這些模型並將其應用到產品中。這包括硬體、軟體和服務。
聊天機器人
正如許多其他基礎模型供應商一樣,聊天機器人在 Google 應用程式方面處於領先地位。再次,透過谷歌搜索,在名稱和功能方面事情變得有點模糊。
雙子座聊天機器人。這曾經被稱為 Bard,與 Gemini 車型完全獨立。十個月前,Bard 和另一款 Google 產品 Duet AI 合併在一起,並推出了 Android 應用程序,並命名為 Gemini 品牌。
在此之後,Gemini 聊天現已整合到更多 Google 產品中,包括 Android Assistant、 鉻合金 瀏覽器、Google 相簿和 Google Workspace。
在撰寫本文時,Gemini 聊天機器人和舊版 Android 助理在最新版本的 Android 手機作業系統上作為雙重選項。 Gemini Live 被視為 OpenAI 低延遲、高速進階語音模式的 Google 替代方案,預計在不久的將來在 Google Pixel 智慧型手機上推出。
產品
雖然 Gemini 作為聊天機器人可能會吸引人工智慧愛好者的大部分新模型和關注,但大多數人工智慧的目光將集中在行動裝置上的 Gemini。
這有兩種形式,首先透過 iPhone 和 Android 上的 Gemini 應用程序,然後透過其深度整合到 Android 作業系統中。
在 Android 上,開發人員甚至可以在自己的應用程式中使用 Gemini Nano 模型,而無需使用基於雲端的或昂貴的模型來執行基本任務。
深度整合允許從 Gemini 觸發系統功能,以及使用 AI 語音助理 Gemini Live 播放歌曲等。
實驗
最新的 Gemini 模型的發布伴隨著一系列與新模型相關的主要 Google 應用程式版本或預覽。這個清單很長而且令人印象深刻。其中一些包括:
- Project Astra:人工智慧助理視覺理解能力的精彩展示
- Project Mariner:展示多模式人工智慧在現實世界用例中的威力
- NotebookLM:研究和學習應用的令人驚嘆的新範式
- 深度研究:極其強大的代理研究工具,具有深度搜尋能力和龐大的上下文
3. 平台
除了 Gemini 的行動和網路版本之外,還有一些優質的、以開發人員為中心的產品。這些通常提供最先進的模型和功能,例如 Gemini Advanced 中的 Deep Research。
- Gemini Advanced:Google針對其人工智慧產品的複雜的基於訂閱的網關。
- Google Cloud:按使用量付費使用全系列 Google 企業與消費者產品
- AI Studio:免費的 AI 遊樂場,用於測試和評估 Gemini 系列 AI 模型
- Vertex AI:人工智慧開發平台集成為 Google Cloud 服務的一部分
- Google One:面向消費者的訂閱雲端儲存服務
Source link
探索更多來自 Gizmo Review 的內容
訂閱後即可透過電子郵件收到最新文章。