2024年12月30日晚,在央視新聞主辦、快手可靈AI技術(shù)支持的《AI奇妙夜》晚會上,來自廈門的AI創(chuàng)作者溫勤,帶著他和小伙伴創(chuàng)作的3部短片亮相。這3部AI短片主題是什么?在制作過程中又有什么挑戰(zhàn)?昨日,記者采訪參加晚會歸來的溫勤。
近百G原始素材 光梳理就用了3天
1月2日上午,記者在同安銀城智谷附近見到了溫勤,雖然剛剛經(jīng)歷高強度的視頻制作身心俱疲,但談到晚會發(fā)布他和小伙伴共同完成的作品時,他還是滿滿的自豪感。
溫勤說,2024年12月初,快手可靈AI團隊聯(lián)系到他,稱計劃與央視新聞在跨年之際推出一臺《AI奇妙夜》晚會,詢問他是否愿意參加。雖然時間緊任務重,但身為AIGC創(chuàng)作者的溫勤,也想挑戰(zhàn)一下這個任務,就愉快地接了下來。
“當時我和央視團隊確定需要制作3部片子,同時央視團隊也打包給我近百G內(nèi)存的原始素材,我光梳理就用去了整整3天時間。”溫勤介紹,這次他一共參與了《奔月》《蔡磊:用AI完成一場演講》《我們》三部短片的制作?!侗荚隆肥峭ㄟ^過去、現(xiàn)在、未來三個時間段展示中國航天科技的發(fā)展,而《蔡磊:用AI完成一場演講》主要以京東集團原副總裁、漸凍癥患者蔡磊抗擊漸凍癥的故事為背景策劃,《我們》則是通過反戰(zhàn)題材的AI短片來呼吁世界和平。
向AI生成工具“投喂”是最大難點
“這三部短片,制作難度都不小,也有各自需要攻克的技術(shù)難題,我想借機挑戰(zhàn)一下自己。”溫勤說,《奔月》這部短片,最大的難點在于如何讓AI理解中國傳統(tǒng)文化中如紅包、中國結(jié)、餃子等元素,為了完成畫面制作,溫勤和小伙伴向AI生成工具“投喂”了大量文字和圖片信息,花費一周時間制作了一百多個鏡頭,最終讓AI生成了合適的畫面。
“蔡磊這部片子制作的最大難點,在于他本人已經(jīng)幾乎無法正常說話,可我們又希望AI能將他的原聲轉(zhuǎn)化成一場完美的演講,這背后的工作量非常之大。”AI輸出的聲音總有一股子“機器人”口音,怎樣才能“原音重現(xiàn)”?溫勤和團隊先后調(diào)取了蔡磊近百部資料視頻,從中提取蔡磊的原聲,做了降噪處理后盡可能讓AI去學習蔡磊說話的各種語氣和聲調(diào),同時讓AI輸出的聲音盡量符合蔡磊本人在進行演講時的情緒變化,讓聲音聽起來更像正常人說話的音調(diào)。“同時我們也查閱了全球著名的TED大會上,各種業(yè)內(nèi)大咖在演講時的燈光、畫面切換、觀眾形態(tài)等內(nèi)容,將它們進行梳理后‘投喂’給AI,最終順利輸出了作品。”溫勤說。
在《我們》這部作品中,觀眾看到畫面兩邊同步顯示的不同地點的孩童看起來年齡相近,但背后是溫勤通過上千個指令,讓AI程序輸出的孩童畫面保持一致性,同時還要通過提示詞來固定畫面兩邊的氛圍,做到始終如一,溫勤為此也付出了不少努力。
希望用AI制作出更多廈門文旅題材短片
學習計算機出身的溫勤在2021年接觸元宇宙相關(guān)產(chǎn)品后,慢慢轉(zhuǎn)型成為一名AI產(chǎn)品經(jīng)理,對市面上的AI生成軟件也是如數(shù)家珍。
在工作和生活中,溫勤會使用AI工具來協(xié)助自己,比如,通過可靈AI實現(xiàn)“老照片擁抱”,通過美圖WHEE實現(xiàn)“建筑物穿毛衣”“AI藝術(shù)字”,當遇到圖片不清晰的時候,會使用WHEE的AI超清功能完成照片修復,當工作需要文檔資料的時候會使用“豆包”“KIMI”進行歸納整理總結(jié)等。
“AI對人類而言,扮演的是一個工具的角色,而我們?nèi)祟悇t是要將內(nèi)心的溫暖傳達給它,才能讓它輸出更多有溫度的產(chǎn)品。”完成了這項挑戰(zhàn)后,溫勤告訴記者,他希望在新一年用AI制作出更多文旅題材的短片,為廈門這座旅游城市做出自己的貢獻。
揭秘
如何讓蔡磊重新說話?
溫勤和團隊先后調(diào)取了蔡磊近百部資料視頻,從中提取蔡磊的原聲,做了降噪處理后盡可能讓AI去學習蔡磊說話的各種語氣和聲調(diào),同時讓AI輸出的聲音盡量符合蔡磊本人在進行演講時的情緒變化,讓聲音聽起來更像正常人的說話頻率。
簡介
●《奔月》:通過過去、現(xiàn)在、未來三個時間段展示中國航天科技的發(fā)展。
●《蔡磊:用AI完成一場演講》:以京東集團原副總裁、漸凍癥患者蔡磊抗擊漸凍癥的故事為背景策劃。
●《我們》:呼吁世界和平的反戰(zhàn)題材短片。
?。◤B門日報記者 薛堯)