昨天 Google 發表了一連串全新的 AI 技術與產品,內容涵蓋模型、設計工具、影片生成、瀏覽器功能等。這次更新不只是概念,而是有許多可以馬上應用的實際工具。以下是這場發表會中,最值得音樂人與創作者關注的 11 項內容:
1. Gemini 2.5 全新升級
Google 最新的語言模型 Gemini 2.5,在邏輯推理與綜合能力上明顯優於目前主流的 GPT-4。即使是較輕量的 Gemini Flash,也在多項測試中表現出色。未來它將整合進 Chrome,能協助你瀏覽網頁、填表單,甚至幫你自動完成留言。
2. Gemma 3N 開源模型
Gemma 是 Google 推出的開放模型系列,這次新推出的 3N 版本表現接近 Claude 3 Sonnet。開發者可以自由商用,適合拿來開發自己的應用服務、教學工具或自動化內容平台。
3. Jules:自動寫代理人的工具
Jules 是一個專門幫你撰寫 AI 程式的工具。你只要給目標,它就能幫你產出能完成特定任務的 AI,降低進入門檻,也讓許多程式開發流程變得更快。
4. Stitch:自動生成 UI 的設計工具
Stitch 可以根據你的需求快速產生介面畫面,並可與 Figma 等設計平台整合。對於不熟前端設計的人來說,是個很實用的協助工具,也能節省不少時間。
5. Flow:AI 製作完整影音內容
Flow 是 Google 專為影像創作者推出的新平台,可以用 AI 自動生成完整的影片內容,包括旁白、畫面與聲音設計。未來很多原本只靠剪輯圖文影片的頻道,都可能會被這類工具取代。
6. Gemini Agent Mode(原代號 Project Mariner)
這項功能讓 Gemini 在瀏覽器中不只能對話,還能執行實際操作,例如按鈕點擊、表單填寫、自動留言等。未來在網路行銷或操作流程自動化上會有不少應用空間。
7. Project Astra:影像即時解說 AI
Astra 能透過手機或攝影機畫面,立刻辨識你看到的東西並做出語音或文字說明。像是分辨哪些野菇可食用,或了解場景環境等。未來會整合進 Android 的智慧眼鏡中。
8. Project Beam:2D 影片轉 3D
Beam 可以將一般的 2D 影片,轉換成立體感更強的 3D 視覺效果。這對線上會議、教學影片、甚至娛樂產業都有潛力。
9. Imageen 和 VO 升級
Google 的圖像與影片生成工具 Imageen 和 VO,現在已經可以同時產生畫面與音效,生成的內容更完整。像是製作影片配樂、旁白或聲音氛圍,都可以自動化完成。
10. 原生 CSS 輪播組件
CSS 現在支援更簡潔的方式製作輪播圖,開發者不必再引入大量外部函式庫,幾百行就能完成以前上千行才能處理的介面設計。
11. Hostinger 虛擬主機(業配)
Hostinger 提供便宜又穩定的 VPS,起價每月不到台幣三百,可以架設 Next.js 等現代前端框架,對於想自行管理伺服器的開發者來說是不錯的選項。
對音樂人與製作人來說,有什麼用?
這次的發表不只是給工程師。像是 Gemma 開源模型,就很適合拿來製作:
- 歌詞生成器
- 音樂評論輔助
- 作品命名工具
- AI 協助的電子書寫作助手
Flow 和 VO 則可以幫你自動產出影片搭配音樂,讓你不用花時間剪輯或找旁白,就能快速推廣作品。
Stitch 和 Jules 則能幫助你開發自己的音樂人平台或工具,加快實作速度。
如果你是音樂創作者、製作人,這些工具會讓你的內容產出變得更快、更便宜,也更容易變現。