Google在 I/O 2024 開發者大會上展示了哪些新內容
Posted: Tue Dec 03, 2024 6:37 am
5 月 14 日,Google I/O 2024 開發者大會舉行了傳統的演講,該公司每年都會在會上展示新設備和技術。 Android 15更新版本和新款Pixel智慧型手機的發佈在預料之中,但人工智慧領域的發展卻佔了上風。我們稍後會告訴您更多有關它們的資訊。
創建圖像的模型 Imagen 3
該公司推出了一種新的生成模型 Imagen 3,它可以根據文字請求創建圖像。與 新加坡商務傳真列表 以前 它的優點包括細節水平高、生成的圖像偽影更少。此模型理解自然語言,並允許您在請求中指定圖像的細節和風格。
作品範例 Imagen 3
目前,Imagen 3 可供選擇的作者透過 ImageFX 的預測試計劃和候補名單進入。計劃在 Vertex AI 中實施新模型。
Veo:利用人工智慧生成視頻
根據 The Verge 報導,Veo 的新生成模型是“Google對 OpenAI Sora 的回應”,可以產生超過一分鐘的各種電影和視覺風格的 1080p 影片。神經網路以自然語言感知請求,同時它可以從長線索中提取細節。幀顯示幀的平滑變化,從而可以創建逼真的運動效果。
Veo操作範例
Google 目前邀請電影製作人和作者申請加入候補名單並參與 VideoFX 的封閉式預測試。

在 Google Lens 中透過影片搜尋
在Google Lens中,您現在不僅可以透過照片進行搜索,還可以透過影片進行搜尋。為此,您可以刪除感興趣的對象,提出澄清問題,然後發送請求。之後,谷歌將開始尋找必要的資訊。
例如,在演示過程中,顯示了一個片段,演示者移除了一個無法工作的黑膠播放器,然後向服務人員詢問可能的原因。結果,她獲得了問題的選擇及其解決方案。
阿斯特拉計劃
Astra是一款基於人工智慧的多功能助手,該公司打算在未來將其轉變為虛擬助理。與其互動是透過設備的攝影機進行的。因此,他將能夠觀察、記住事物的位置並代表使用者執行任務。
Gemini 旗艦人工智慧的更新
發表會上展示了Gemini 1.5 Flash版本,號稱是該系列中最快的,也是基於API工作的。它旨在大規模處理大量資訊和高頻任務。 1.5 Flash 可以進行短距離傳輸、在聊天模式下工作、為影像和視訊建立字幕、從長文件和表格中提取資訊等等。
Gemini 1.5 Pro型號有了顯著改進。現在,她更擅長創建程式碼、規劃和邏輯思維、多步驟對話等任務。創建者添加了音訊和圖像的神經網路處理,以及容量高達 200 萬個令牌的長上下文窗口,使您可以給出更複雜的指令。 Gemini 1.5 Pro預計將整合到Google產品中,包括Gemini Advanced和Workspace應用程式。更新將於下個月向付費訂閱者提供。
Gemini Live 將允許您與 Gemini 進行交流,他將充當對話者。神經網路將回答問題,講述它所看到的周圍情況,透過攝影機即時辨識物體。這不僅與智慧型手機的相機有關,還與眼鏡有關。此功能仍在開發中。
谷歌搜尋更新
AI Overviews未來將在搜尋引擎中實現。當您輸入查詢時,它將產生結果頁面,其中包含來自網路的簡短答案。為此,服務將選擇在請求的輸出中顯示且已記錄更多點擊的連結。這項新功能將於本周向美國所有用戶開放。
還有什麼有趣的
除上述內容外,簡報還介紹了其他重要的新穎性和更新:
合成ID。這些浮水印應該用來標記照片、影片甚至音樂。這項決定旨在打擊深度造假和保護版權。
圈出搜尋。此功能透過將複雜的數學問題分解為多個步驟,幫助使用者解決複雜的數學問題。為此,您需要選擇對象,然後系統會發出提示。
谷歌寶石。作為 Gemini Advanced 付費版用戶的個人化助手。
雙子座奈米。這是一個整合到桌面版 Chrome 中的助手。假設在它的幫助下,將可以在瀏覽器視窗中為社交網路、筆記等建立文字。
創建圖像的模型 Imagen 3
該公司推出了一種新的生成模型 Imagen 3,它可以根據文字請求創建圖像。與 新加坡商務傳真列表 以前 它的優點包括細節水平高、生成的圖像偽影更少。此模型理解自然語言,並允許您在請求中指定圖像的細節和風格。
作品範例 Imagen 3
目前,Imagen 3 可供選擇的作者透過 ImageFX 的預測試計劃和候補名單進入。計劃在 Vertex AI 中實施新模型。
Veo:利用人工智慧生成視頻
根據 The Verge 報導,Veo 的新生成模型是“Google對 OpenAI Sora 的回應”,可以產生超過一分鐘的各種電影和視覺風格的 1080p 影片。神經網路以自然語言感知請求,同時它可以從長線索中提取細節。幀顯示幀的平滑變化,從而可以創建逼真的運動效果。
Veo操作範例
Google 目前邀請電影製作人和作者申請加入候補名單並參與 VideoFX 的封閉式預測試。

在 Google Lens 中透過影片搜尋
在Google Lens中,您現在不僅可以透過照片進行搜索,還可以透過影片進行搜尋。為此,您可以刪除感興趣的對象,提出澄清問題,然後發送請求。之後,谷歌將開始尋找必要的資訊。
例如,在演示過程中,顯示了一個片段,演示者移除了一個無法工作的黑膠播放器,然後向服務人員詢問可能的原因。結果,她獲得了問題的選擇及其解決方案。
阿斯特拉計劃
Astra是一款基於人工智慧的多功能助手,該公司打算在未來將其轉變為虛擬助理。與其互動是透過設備的攝影機進行的。因此,他將能夠觀察、記住事物的位置並代表使用者執行任務。
Gemini 旗艦人工智慧的更新
發表會上展示了Gemini 1.5 Flash版本,號稱是該系列中最快的,也是基於API工作的。它旨在大規模處理大量資訊和高頻任務。 1.5 Flash 可以進行短距離傳輸、在聊天模式下工作、為影像和視訊建立字幕、從長文件和表格中提取資訊等等。
Gemini 1.5 Pro型號有了顯著改進。現在,她更擅長創建程式碼、規劃和邏輯思維、多步驟對話等任務。創建者添加了音訊和圖像的神經網路處理,以及容量高達 200 萬個令牌的長上下文窗口,使您可以給出更複雜的指令。 Gemini 1.5 Pro預計將整合到Google產品中,包括Gemini Advanced和Workspace應用程式。更新將於下個月向付費訂閱者提供。
Gemini Live 將允許您與 Gemini 進行交流,他將充當對話者。神經網路將回答問題,講述它所看到的周圍情況,透過攝影機即時辨識物體。這不僅與智慧型手機的相機有關,還與眼鏡有關。此功能仍在開發中。
谷歌搜尋更新
AI Overviews未來將在搜尋引擎中實現。當您輸入查詢時,它將產生結果頁面,其中包含來自網路的簡短答案。為此,服務將選擇在請求的輸出中顯示且已記錄更多點擊的連結。這項新功能將於本周向美國所有用戶開放。
還有什麼有趣的
除上述內容外,簡報還介紹了其他重要的新穎性和更新:
合成ID。這些浮水印應該用來標記照片、影片甚至音樂。這項決定旨在打擊深度造假和保護版權。
圈出搜尋。此功能透過將複雜的數學問題分解為多個步驟,幫助使用者解決複雜的數學問題。為此,您需要選擇對象,然後系統會發出提示。
谷歌寶石。作為 Gemini Advanced 付費版用戶的個人化助手。
雙子座奈米。這是一個整合到桌面版 Chrome 中的助手。假設在它的幫助下,將可以在瀏覽器視窗中為社交網路、筆記等建立文字。