可靈AI推出“多圖參考”功能 進一步攻克AI視頻一致性難題
近日,快手可靈AI正式面向全球推出“多圖參考”模式,該功能能夠理解和整合多個圖片中的不同主體,根據(jù)用戶的文字描述,創(chuàng)造性地生成融合視頻,進一步攻克了AI視頻生成中的一致性難題。
2025-01-23 15:06:26
來源:丁科技網??

近日,快手可靈AI正式面向全球推出“多圖參考”模式,該功能能夠理解和整合多個圖片中的不同主體,根據(jù)用戶的文字描述,創(chuàng)造性地生成融合視頻,進一步攻克了AI視頻生成中的一致性難題。

目前,全球用戶均可在可靈1.6模型下,使用“多圖參考”功能。用戶只需選擇圖生視頻,上傳1-4張參考圖,框選圖片中需要使用的人物、動物、物品或場景,并通過“提示詞”描述它們之間的變化或互動,可靈AI即可結合所有參考內容并遵從指令生成視頻。

用戶可以上傳一張或多張同一主體(人物、動物、影視角色或物品等)的圖片,模型會以這些圖片為參考,生成統(tǒng)一風格的視頻,幫助用戶在制作AI視頻時保證多鏡頭中的主體一致。例如,用戶上傳貓、夾克、太陽鏡三張圖片,并輸入提示詞“一只身穿夾克、戴著太陽鏡的擬人化貓在舞臺上轉身并對著鏡頭擺姿勢,”隨后進行生成,就可以得到符合指令的視頻。

此外,用戶還可以通過參考圖來指定場景、服裝和動作等,讓人物在特定環(huán)境中完成特定“演出”,大幅提升創(chuàng)作的可控性。例如,我們分別上傳一個老爺爺、一杯咖啡、咖啡館場景三張參考圖片,并輸入相應提示詞“一個卡通風格的老爺爺在咖啡館里,端起咖啡杯”來進行生成,便可得到老爺爺坐在咖啡館里喝咖啡的視頻 。

同時,“多圖參考”還可以支持不同角色之間的互動。用戶可以上傳多個人物、動物或者影視角色等圖片,并用文字描述他們之間的互動。例如,我們分別上傳小男孩、柯基犬兩張參考圖,并輸入提示詞“一個可愛的小男孩在撫摸一只柯基犬”,即可生成下圖所示的視頻。

此前,可靈AI已在全球上線“人臉模型”功能,支持用戶通過上傳多段視頻來訓練、定制人臉模型,并參照該人臉模型繼續(xù)生成視頻內容。作為業(yè)內首個視頻模型定制功能,“人臉模型”創(chuàng)新性地滿足了用戶創(chuàng)作多個包含同一人物鏡頭的需求。

隨著“多圖參考”功能的推出,可靈AI進一步解決了視頻生成中的一致性難題,幫助用戶充分發(fā)揮創(chuàng)造力,自由組合各種圖片元素,打造獨特的創(chuàng)意場景,探索更多可能。

最新文章
1
2025慕尼黑光伏展上,華寶新能新一代家庭綠電系統(tǒng)如何贏得全球矚目?
2
全域出擊,引爆618,磁力金牛618活動玩法來襲,預熱會場即將上線
3
快手電商商家大會達人分論壇探索私域新增量,多種方式加速新達人成長
4
快手本地生活“五一”假期GMV同比增長108%,新線城市消費力爆發(fā)
5
2025年一季度電視銷售額規(guī)模同比增長3.4%,高端品質化提速
6
分拆安得智聯(lián)“赴港”,美的在下一盤什么棋?
7
不卷了?美的海信攜手 友商變伙伴!
8
中國客廳最貴智能設備!閨蜜機銷量大漲超42%
9
國內監(jiān)控攝像頭第一季度銷量如何 小米成電商霸主 銷量、銷額雙第一!
10
史無前例!曝折疊屏iPhone首發(fā)三星全新面板:折痕幾乎不可見
11
把家打造成超級玩家基地!Vidda貼貼壁紙電視和C3系列投影發(fā)布
12
100英寸電視銷量暴增150%,成為電視行驅動換新的主力軍
13
realme概念機搭載10000毫安時電池,充電寶可能要退役了?!
14
內銷承壓之下,小家電企業(yè)押注出海能翻盤嗎?
15
技術、國補雙軌并行,智能馬桶行業(yè)迎來結構性增長黃金期
16
蘋果高管:10年后你可能不需要iPhone了
17
聯(lián)想moto razr 60 Ultra國行今天發(fā)布:首款驍龍8至尊版小折疊
18
全球最薄驍龍8至尊版旗艦!三星Galaxy S25 Edge官宣
19
快手電商在鄭州舉辦新商培訓會,助力服裝檔口商家開拓新渠道
20
快手電商上線618蓄水期開播助推政策,助力商家達人在五一假期收獲經營增長
關于我們

微信掃一掃,加關注

商務合作
  • QQ:61149512