Google Gemini 整合 Lyria 3 模型,支援以文字或圖片提示詞生成 30 秒音軌。為防範濫用,所有 AI 生成音訊皆強制嵌入 SynthID 數位浮水印以供識別。Google Gemini 整合 Lyria 3 模型,支援以文字或圖片提示詞生成 30 秒音軌。為防範濫用,所有 AI 生成音訊皆強制嵌入 SynthID 數位浮水印以供識別。

Gemini 導入 Lyria 3 音樂生成模型 一句話或一圖生成 30 秒個人歌曲

2026/02/20 12:41
閱讀時長 5 分鐘

Google 表示 Gemini 將導入 Lyria 3 音樂生成模型,用戶只需輸入一句話或一幅圖片即可生成 30 秒個人化歌曲作品。
Google稍早宣布,旗下AI助理Gemini已經正式整合由DeepMind團隊開發的最新一代音樂生成模型Lyria 3。這意味著,使用者現在不需要具備任何專業的樂理知識,只要透過簡單的文字指令、一張照片,甚至一段影片,就能讓Gemini直接在對話框內「唱」出一首長達30秒的高音質 (High-fidelity)音樂片段。

不只寫歌,連歌詞和專輯封面都幫你準備好

過去要製作一段音樂,必須經過編曲、填詞、錄音等繁雜步驟。但在Lyria 3的加持下,Gemini大幅降低了跨入音樂創作的門檻。

根據Google的示範,使用者只要輸入像「一首關於襪子找到另一半的滑稽R&B慢板情歌」這種口語化的提示詞,系統就能產出具備相當水準的音樂。

如果你對音樂有更具體的要求,Lyria 3也支援更細緻的微調 (Granular Control),例如你可以明確要求改變特定段落的節奏快慢、調整鼓點風格,或是變更整體的音樂情緒。

更令人驚豔的是,Gemini的音樂生成不侷限於「文字」。使用者可以上傳一張夕陽照片或一段生活短影音,讓AI根據視覺氛圍生成相符的配樂。當歌曲生成完畢後,系統還會自動呼叫Google旗下的Nano Banana影像模型,為這首歌生成一張專屬的專輯封面,讓整個創作體驗更加完整。

整合YouTube Shorts,SynthID浮水印防濫用

這項技術的應用場景不僅停留在Gemini網頁版,Google也宣布Lyria 3將同步整合進YouTube的「Dream Track」功能中,讓創作者能快速為自己的Shorts短影音生成極具細節的背景配樂。

當然,AI生成音樂最敏感的無非是版權爭議與真實性問題。

為了防止AI音樂被惡意濫用或偽冒為真人作品,所有透過Lyria 3生成的30秒音軌,都會在底層強制嵌入Google的SynthID數位浮水印。這種浮水印無法被人類肉耳察覺,但只要透過Google在去年Google I/O開發者大會上推出的SynthID Detector工具,就能輕易辨識出該段音訊是否由機器生成。

上手體驗:伴奏驚艷,但「人工填詞」仍有進步空間

根據外媒實際測試的初步回饋,Lyria 3在「器樂伴奏」 (Instrumental)部分的表現非常出色,能產出極具層次感與真實感的旋律。不過,當涉及到由AI自動生成的「歌詞與人聲演唱」時,目前的表現有時仍會顯得有些俗氣,或是帶有不自然的機械感,這是使用者在實際操作時可能需要反覆嘗試調整的地方。

目前這項音樂生成功能已從即日起陸續開放給全球年滿18歲以上的Gemini用戶使用。首波支援英語、西班牙語、德語、法語、北印度語、日語、韓語及葡萄牙語等8種語言。

資料來源

  • https://mashdigi.com/google-is-turning-everyone-into-a-composer-gemini-imports-lyria-3-models-allowing-you-to-generate-a-30-second-personal-hit-song-with-just-a-sentence-or-an-image/
免責聲明: 本網站轉載的文章均來源於公開平台,僅供參考。這些文章不代表 MEXC 的觀點或意見。所有版權歸原作者所有。如果您認為任何轉載文章侵犯了第三方權利,請聯絡 service@support.mexc.com 以便將其刪除。MEXC 不對轉載文章的及時性、準確性或完整性作出任何陳述或保證,並且不對基於此類內容所採取的任何行動或決定承擔責任。轉載材料僅供參考,不構成任何商業、金融、法律和/或稅務決策的建議、認可或依據。