科技媒體《The Verge》報道,Alphabet(GOOGL.US) 旗下谷歌(Google)的人工智能部門Google DeepMind,宣布推出兩款人工智能模型,協助機械人處理更廣泛的現實世界任務。
其中Gemini Robotics為結合視像、語言及行動模型,能在未經訓練下了解新環境。該語言基於谷歌旗艦人工智能模型Gemini 2.0。新模型在三個領域取得進展,有助最終建立可提供協助的機械人,包括概括性、互動性及靈巧性。除能概括環境,亦可更佳地與人類及環境互動,且能進行更精確任務,譬如摺疊紙張或移除瓶蓋。
另一模型為Gemini Robotics-ER,為視像語言模型的先進版,可了解複雜及動態的世界。據Google DeepMind指,該款模型可處理較複雜任務,譬如為午餐盒進行包裝,當中涉及打開包裝盒、如何拿取食物及如何安放食物於盒內等。(fc/j)(美股為即時串流報價; OTC市場股票除外,資料延遲最少15分鐘。)
AASTOCKS新聞