Games Data Forum

Posted: **Tue Dec 03, 2024 6:37 am**

5 月 14 日，Google I/O 2024 開發者大會舉行了傳統的演講，該公司每年都會在會上展示新設備和技術。 Android 15更新版本和新款Pixel智慧型手機的發佈在預料之中，但人工智慧領域的發展卻佔了上風。我們稍後會告訴您更多有關它們的資訊。

創建圖像的模型 Imagen 3
該公司推出了一種新的生成模型 Imagen 3，它可以根據文字請求創建圖像。與新加坡商務傳真列表以前它的優點包括細節水平高、生成的圖像偽影更少。此模型理解自然語言，並允許您在請求中指定圖像的細節和風格。

作品範例 Imagen 3

目前，Imagen 3 可供選擇的作者透過 ImageFX 的預測試計劃和候補名單進入。計劃在 Vertex AI 中實施新模型。

Veo：利用人工智慧生成視頻
根據 The Verge 報導，Veo 的新生成模型是“Google對 OpenAI Sora 的回應”，可以產生超過一分鐘的各種電影和視覺風格的 1080p 影片。神經網路以自然語言感知請求，同時它可以從長線索中提取細節。幀顯示幀的平滑變化，從而可以創建逼真的運動效果。

Veo操作範例

Google 目前邀請電影製作人和作者申請加入候補名單並參與 VideoFX 的封閉式預測試。

在 Google Lens 中透過影片搜尋
在Google Lens中，您現在不僅可以透過照片進行搜索，還可以透過影片進行搜尋。為此，您可以刪除感興趣的對象，提出澄清問題，然後發送請求。之後，谷歌將開始尋找必要的資訊。

例如，在演示過程中，顯示了一個片段，演示者移除了一個無法工作的黑膠播放器，然後向服務人員詢問可能的原因。結果，她獲得了問題的選擇及其解決方案。

阿斯特拉計劃
Astra是一款基於人工智慧的多功能助手，該公司打算在未來將其轉變為虛擬助理。與其互動是透過設備的攝影機進行的。因此，他將能夠觀察、記住事物的位置並代表使用者執行任務。

Gemini 旗艦人工智慧的更新
發表會上展示了Gemini 1.5 Flash版本，號稱是該系列中最快的，也是基於API工作的。它旨在大規模處理大量資訊和高頻任務。 1.5 Flash 可以進行短距離傳輸、在聊天模式下工作、為影像和視訊建立字幕、從長文件和表格中提取資訊等等。

Gemini 1.5 Pro型號有了顯著改進。現在，她更擅長創建程式碼、規劃和邏輯思維、多步驟對話等任務。創建者添加了音訊和圖像的神經網路處理，以及容量高達 200 萬個令牌的長上下文窗口，使您可以給出更複雜的指令。 Gemini 1.5 Pro預計將整合到Google產品中，包括Gemini Advanced和Workspace應用程式。更新將於下個月向付費訂閱者提供。

Gemini Live 將允許您與 Gemini 進行交流，他將充當對話者。神經網路將回答問題，講述它所看到的周圍情況，透過攝影機即時辨識物體。這不僅與智慧型手機的相機有關，還與眼鏡有關。此功能仍在開發中。

谷歌搜尋更新
AI Overviews未來將在搜尋引擎中實現。當您輸入查詢時，它將產生結果頁面，其中包含來自網路的簡短答案。為此，服務將選擇在請求的輸出中顯示且已記錄更多點擊的連結。這項新功能將於本周向美國所有用戶開放。

還有什麼有趣的
除上述內容外，簡報還介紹了其他重要的新穎性和更新：

合成ID。這些浮水印應該用來標記照片、影片甚至音樂。這項決定旨在打擊深度造假和保護版權。
圈出搜尋。此功能透過將複雜的數學問題分解為多個步驟，幫助使用者解決複雜的數學問題。為此，您需要選擇對象，然後系統會發出提示。
谷歌寶石。作為 Gemini Advanced 付費版用戶的個人化助手。
雙子座奈米。這是一個整合到桌面版 Chrome 中的助手。假設在它的幫助下，將可以在瀏覽器視窗中為社交網路、筆記等建立文字。

Games Data Forum

Google在 I/O 2024 開發者大會上展示了哪些新內容

Google在 I/O 2024 開發者大會上展示了哪些新內容