來源
iThome新聞
內容
Alphabet旗下的AI子公司DeepMind正在研究如何幫「生成式影片」生成背景聲音,利用影片至聲音(video-to-audio,V2A)技術來替這些原本無聲的影片加上應有的對話、音效或配樂。
目前DeepMind的V2A技術並不是直接餵入影片就能生成聲音,而是結合了自然語言的提示以幫螢幕上的畫面配音,相容於諸如Veo等影片生成模型,並支援包括檔案、無聲電影等影片內容。
來源
iThome新聞
內容
Alphabet旗下的AI子公司DeepMind正在研究如何幫「生成式影片」生成背景聲音,利用影片至聲音(video-to-audio,V2A)技術來替這些原本無聲的影片加上應有的對話、音效或配樂。
目前DeepMind的V2A技術並不是直接餵入影片就能生成聲音,而是結合了自然語言的提示以幫螢幕上的畫面配音,相容於諸如Veo等影片生成模型,並支援包括檔案、無聲電影等影片內容。
Copyright © 2024 | 國立陽明交通大學 All rights reserved