【生活中心/綜合報導】Google搜尋又有新突破!想像一下,當你在國外看到某個建築,但卻不知這建築的任何資訊時,只要打開手機用鏡頭對準建築,手機就會詳細解說,而你完全不用「打字搜尋」。這是GOOGLE旗下產品Gemini Live推出的全新模型「搜尋 Live」功能,搜尋不再只是冷冰冰的關鍵字輸入,而是一位能聽、能看、還能跟你即時對談的超強 AI 助手。
搜尋新紀元 動口不動手的 AI 隨身助理
Google今天宣布Gemini Live推出全新模型「搜尋 Live」,這項功能擴展的核心動力源自於Google最新開發的Gemini 3.1 Flash Live音訊與語音模型。Google表示,這款模型不僅大幅提升了處理資訊的速度與系統穩定性,更賦予了AI極強的多國語言處理能力,讓全球使用者能以自己最親近、最習慣的語言進行交談,徹底打破了以往搜尋時必須精準輸入關鍵字的隔閡。


當使用者遇到單純文字難以精確表達需求的時刻,只要開啟 Gemini App 並點擊右下方的Live圖示,就能直接進入即時語音對話模式。在對話過程中,使用者可像與朋友聊天一樣持續追問。
Gemini Live 新模型最厲害的是,除了語音互動更將視覺資訊納入對話系統中,當使用者面對眼前的實體物品感到困惑時,例如面對一組複雜的層架卻不知如何組裝,只需開啟相機功能,Gemini Live便能解說畫面中的各項物品。
化身全能行動導遊 視覺辨識讓「看見」即「理解」
舉例來說,如果你去義大利旅遊,若眼前出現一座令你好奇卻叫不出名字的古老建築,你不需在腦中苦思建築的特徵來轉換成文字關鍵字,只要在手機上打開 Gemini App,點擊搜尋列右側「Live」圖示,然後點擊左邊的相機圖示,能直接對著手機開口詢問,例如:「這座教堂叫什麼名字?它為什麼有這麼多精細的雕塑?」
此時,Gemini Live 會同步分析相機捕捉到的視覺資訊,並結合Google資料庫即時透過語音向你解釋。它不僅能告訴你這座建築的名稱與建造年代,你還能像與隨身導遊聊天一樣持續追問,比如好奇「門口的雕塑代表什麼故事?」或是「現在可以進去參觀嗎?」它會根據你鏡頭對準的畫面細節給出精準回覆。
這種互動方式最迷人之處在於它打破了語法與空間的限制,即便你對義大利建築史一竅不通,或是不知道該如何精確描述那些巴洛克風格的裝飾,只要讓 搜尋「看見」你所看到的畫面,它就能理解你的困惑。


精準辨識物品 價格估算仍有進度空間
或者,如果您到法國旅遊時,看到一輛喜歡的單車,只要用Gemini Live對準法國街頭的單車,它就會辨識出別出這台單車的品牌、型號甚至是具體的零件規格。此時你只需直接開口詢問:「這台車在法國當地的售價是多少?附近有沒有車店有現貨,價格比其他地區便宜嗎?」系統便會結合地理位置資訊與 Google 購物的龐大資料庫,即時掃描周邊零售商的線上清單。
《客新聞》實測Gemini Live功能,開啟APP後將手機鏡頭對準相機、牆上的海報、或是同事的安全帽,Gemin果然精準地說出各物品的品牌型號。隨後,記者將鏡頭對準一些不知名的盆栽,沒想到Gemini Live也正確說出:「左邊的的小盆栽是條紋葉吊蘭。」但Gemini Live還是會有辨識誤差的時候,例如記者請它估計相機或安全帽價格時,就出現較大的落差。
Google表示,Gemini Live的「搜尋 Live」全新模型已在全球超過150個國家開放這項功能,可用45種語言與使用者交談,在Android或iOS裝置上都可安裝Gemini APP使用。





