您現在的位置是:知識 >>正文
别吹Sora了,影视行业死得没那么快
知識25161人已圍觀
簡介自從OpenAI公布全新的生成式人工智能模型Sora之后,可謂是“一石激起千層浪”,相關的討論一直沒有停止。關于這個號稱“只要輸入文本指令,就能輸出60秒視頻”的新工具,人們感到期待、焦慮、恐懼……共 ...
自從OpenAI公布全新的生成式人工智能模型Sora之后,可謂是“一石激起千層浪”,相關的討論一直沒有停止。
關于這個號稱“只要輸入文本指令,就能輸出60秒視頻”的新工具,人們感到期待、焦慮、恐懼……共同組成了一幅巨大的“Sora亂象圖”。一方面,各種標簽上寫著“該視頻由Sora生成”,但實際上是網友制作的搞怪視頻成為了“整活”的流量密碼,讓不少網絡樂子人收獲了歡樂。
網友將搞怪視頻打上“該視頻由sora生成的標簽”
另一方面,雖然Sora并沒有開放使用,但網絡上卻出現了一大批“培訓機構”,利用行業焦慮和信息不對稱,打起了收割韭菜的算盤。一個自稱清華博士的賣課博主,入門AI課達到了199元一份,光是在視頻號里,就賣出了520多份。還有人扒出,這門AI課他一年售出了25萬套,銷售額將近5000萬。于是網友們紛紛陰陽怪氣地稱他為:唯一可以與奧特曼平起平坐的AI巨頭。
網友制作的梗圖
Sora究竟是什么?
Sora,源自日語“空(そら,發音為sora)”,不僅指代天空,還象征著無垠的空間和無限的可能性,從而引申出自由的寓意。在OpenAI關于Sora的介紹中,首頁就可以看到無數在空中自由飛翔的紙飛機,象征著Sora模型的自主性和創造性,反映出“空”所蘊含的自由理念。
Sora介紹頁面
關于Sora生成的各種視頻我想大伙應該都已經見得不少了,相信很多人在看完視頻之后都會有一個疑問:Sora是如何生成視頻的呢?
在OpenAI放出的技術報告中是這樣描述Sora的:Sora是一個“擴散變換器(Diffusion Transformer)”。與傳統的變換器(包括編碼器和解碼器)在處理方式上存在類似之處,但其處理的并不是文本標簽,而是被稱為“補丁(Patches)”的視覺數據。
補丁(Patches),其實就是大模型在處理視頻和圖像數據時,將視覺數據分解成小塊或小部分的一種方法。通過將視頻壓縮到一個低維度的潛在空間,把空間的標識分解成為多個補丁,以此來讓模型更好地處理和生成高質量的視頻和圖像內容。這種方法的優勢在于能夠允許模型處理不同分辨率、持續時間和寬高比的視覺數據,為視頻和圖像生成提供了更大的靈活性和能力。
視覺編碼過程
而“擴散變換器”則是一種結合了擴散模型和變換器架構的技術,能夠通過利用變換器處理數據間復雜關系的能力,以及擴散模型逐步精煉數據的策略,來生成或預測視頻和圖像中的“干凈”補丁,逐步從包含噪聲的數據中恢復出干凈的數據,來生成圖像或視頻。
我們舉個簡單的例子,假如我們現在有一張狗狗的照片,我們可以一步步給這張照片增加噪點,讓它變得越來越模糊,最終會變成一堆雜亂的噪點。如果我們把這個過程倒過來,對于一堆雜亂無章的噪點,我們同樣可以一步步去除噪點,把它還原成目標圖片,而擴散模型的關鍵就在于學會逆向去除噪點。
事實上,此前大火的Midjourney和Stable Diffusion的圖像和視頻生成器就同樣基于擴散模型,不過不同的是Sora能夠通過讓模型一次預測多幀畫面,確保了即使被攝體在離開視線后仍然能保持不變,也使其展示出了對影視拍攝語法的全新自發理解,不僅可以跟隨對象移動鏡頭,還可以在移動鏡頭轉換角度的時候,仍然能夠保持畫面的合理與完整。
Sora另一個很強的地方在于,它“繼承”了OpenAI對文本的理解能力,能夠根據提示詞生成高質量的圖片和視頻,并且能夠對視頻進行向前或向后的擴展,例如,在這個官網展示的這個視頻中,Sora能夠基于同一個視頻開頭進行拓展,延伸出不一樣的結尾,或從不同的開頭引入,最終得到同一個結尾。
三個視頻開頭最終都會走向同一個結尾
不過事實上,OpenAI的野心遠不止于此,Sora不僅是一個創造性的工具,它實際上還是一個基于數據的復雜模擬系統,能夠模擬現實或想象中的世界。它通過學習如何正確地渲染場景、模擬物理行為、進行長期推理和理解場景的含義,從而創建出逼真的 3D 場景和動畫。
這就使其能夠創造出很多現實中不存在的視頻,例如在下面這個視頻中,提示詞為“兩艘海盜船在一杯咖啡中航行時相互爭斗的逼真特寫視頻”。這樣的要求不僅需要Sora生成一個逼真的3D模型,還需要讓這些模型根據物理規則動畫化,并模擬液體的動力學,還要使用高級渲染技術來實現照片級的真實感,即使場景的語義在現實世界中并不存在,但引擎仍然能實現我們期望的正確物理規則。
這一點雖然目前Sora仍有缺陷,但確是一個很有前景的目標,通過建立這樣一個復雜的模擬系統,我們就能夠對真實世界進行建模和預測,甚至是構建起真實世界的數字交互。無論Google、OpenAI還是馬斯克的xAI,終極目的都是構建起世界模型,就比方說電影《流浪地球2》里面的MOSS,就是一個強人工智能的化身,能夠通過構建真實世界模型,再加上強大的算力,來推演不同選擇導致的結果,達到預測的目的,這或許就是很多人眼中AI的終極形態了吧。
不過無論如何,這些都是后話了。
Sora真會砸掉整個影視行業的飯碗?
事實上,人工智能從誕生的那一天起,就常常會成為很多人幻想中的“假想敵”,而隨著ChatGPT等新工具的發展,對于AI的遙遠恐懼漸漸演變成了近在眼前的對飯碗的深深擔憂,在Sora發布后更是如此。
單就Sora生成視頻的能力來看,首當其沖的必然是影視從業者。畢竟傳統方式制作一段1分鐘的視頻成本非常高,除了場景、燈光、演員,還要提前溝通分鏡、找好角度、考慮好攝像機與演員的走位等。如果再需要一些特殊因素,例如轉瞬即逝的光影、理想的天氣條件等,那就更要賭一賭運氣了。
而這一切在Sora這里都不是問題,只要通過簡單的提示語句,就可以直接生成視頻,而且相較于之前的AI工具,無論是視頻的時長、畫面精細度,還是細節的完整性,甚至是多鏡頭拍攝,Sora都可以用“碾壓”來概括,很明顯將會為相關從業者帶來更大影響。
網友制作的梗圖,好萊塢經典標識“HOLLYWOOD”變成了“SORAWOOD”
行業調查公司CVL Economics不久前發布的一項對好萊塢行業領袖的調查顯示,目前憂慮的情緒正籠罩著整個好萊塢,36%的受訪者表示生成式AI已經減少了他們公司的日常工作技能需求,72%的受訪公司都是生成式AI工具的最早采用者。
而在這其中還有75%的受訪者表示,生成式AI工具已經促使他們業務部門削減與合并相關的工作崗位。還有人預計,未來三年好萊塢總計會有超過20萬人的工作崗位會受到AI沖擊,其中尤其是視覺特效、音效師、畫圖師等后期工作崗位。
事實上,受到影響的并不只有影視行業從業者。面對來自Sora的“降維打擊”,AI視頻領域的創業者中,有的如Runway CEO克里斯托瓦爾·巴倫蘇埃拉一樣,做好了“Game On”的準備,有的如Pika創始人郭文景一樣,開始籌備對標Sora的新產品,也有人如Stability AI CEO埃馬德·莫斯塔克一樣,不由感慨“阿爾特曼真是一個魔術師”,并將Sora視為AI視頻界的GPT-3時刻。這一次,很多人真的感受到了危機感。
風物長宜放眼量
雖然Sora確實很勁爆,但如果因此而過分焦慮也大可不必。一方面由于Sora在其生成的視頻中仍然存在很多經典的“靈魂錯誤”。例如在很多視頻中,人物、動物會憑空消失、變形或者變出分身;還會出現一些違背物理常識的“鬧鬼”畫面,像人吹過的蠟燭沒有變化、穿過籃筐的籃球、懸浮移動的椅子等。
Sora生成的視頻中,老人吹蠟燭前后火苗紋絲不動,略顯詭異
另一方面也在于,AI在視頻生成的邏輯與人類的創作邏輯是截然不同的,這從根本上決定了Sora并不能真正辨別故事的好壞。畢竟影視是從人的情感出發,最后也以觸動人類情感為目的,也許隨著生成技術的發展,其視頻邏輯、質量和對真實世界的模擬程度會有更高的提升,但卻不能代替人類在影視制作過程中起到的作用。還有很多人認為,越是機器生成的東西,很多時候會愈發讓我們感受到人類之作的珍貴,例如帶著“鍋氣”的食物很多時候優于預制菜、凝聚了工人心血的器具雖然精確度不如機械但卻有更多的“溫度”……這樣的例子可謂俯仰皆是,更何況是在影視這一最能體現人類情感、囊括各種藝術門類的綜合藝術呢?
事實上,除開影視劇作、劇情設計等方面的元素,即使僅從視頻呈現的而言,AI生成的內容在信息量上并不能與真實拍攝相比,例如在很多電影場景中,人物的表達、語氣、表情的背后,不僅是各種細膩的人類情感,舉手投足之間積累的是半生的經歷、情緒與風土人情的總和。
這些內容雖然看似并不顯眼,但卻時時刻刻都在傳達很多信息,正是這些內容才真正組合成了每一個與眾不同的人,也經由各種反應、互動形成了人物之間情緒的流動,也正是這些細節的變化,在無聲無息地影響著我們的情緒,為我們帶來感動,這是生成式AI很難做到的,或許這才是很多AI生成視頻看起來“沒有靈魂”的根本原因。
幾乎全片都由對話構成的經典電影《愛在黎明破曉前》
此外,在影視行業中使用AI早已不是新鮮事,此前曾在好萊塢橫掃最佳影片、最佳導演等7大獎項的《瞬息全宇宙》就曾使用Runway的AI視頻工具,去年21世紀福克斯已經與IBM沃森合作,用AI工具為關于AI主題的恐怖片《摩根》制作預告片,迪士尼旗下的漫威則完全使用AI制作了《秘密入侵》的開頭動畫。
不久前,NVIDIA創始人黃仁勛曾在一次參訪中表示,“在過去的10年、15年中,幾乎每個人都會告訴你,學計算機對孩子來說至關重要,每個人都該學習如何編程。但事實上,情況完全相反,我們的工作是創造計算技術,使得任何人都不再需要編程,使得編程語言變成人性的,現在世界上每一個人都是程序員,技術鴻溝已經完全彌合。”
而這似乎成為了AI時代的真實寫照,無論ChatGPT-4也好、Sora也罷,通過借助日新月異的新技術,不懂編程語言的人也能夠制作軟件程序,沒有影視相關技術背景的人也能夠從容地制作自己的視頻,這無疑將會進一步,激活新的產能,促進行業的發展,甚至是讓人和人之間產生新的鏈接,這或許才是生成式AI的更大意義。
我們有理由期待,未來必然會有更多的AI技術和電影或電視劇制作的結合與創新,也許會出現一些我們從未想象過的精彩作品,給我們帶來更多驚喜。
Tags:
相關文章
東西問丨馬志明:相聲能否成為“中西共笑”的語言?
知識中新社天津6月29日電 題:相聲能否成為“中西共笑”的語言?
——專訪相聲表演藝術家馬志明
中新社記者 王君妍 周亞強
相聲,作為中國傳統語言藝術的重要門類,歷經百余年傳承演變,逐漸發展為深受大眾喜愛的表演藝術形式。它不僅承載著中國人獨特的幽默智慧與語言審美,也成為中國非物質文化遺產體系中極具辨識度的“聲音符號”。
近日,中國國家級非物質文化遺產代表性項目“相聲”代表性傳承人之一、相聲表演藝術家馬志明接受中新社“東西問”專訪,圍繞“馬氏相聲”的風格脈絡、天津與相聲的雙向滋養、傳統與創新的平衡之道,以及相聲“出海”的現實可能等話題,分享他幾十年舞臺經驗與文化思考。
視頻:【東西問】馬志明:相聲能否成為“中西共笑”的語言?來源:中國新聞網
現將訪談實錄摘要如下:
中新社記者:“馬氏相聲”有何特點?
馬志明:“馬氏相聲”是一種風格的傳承。我的家族成員從藝至今已150多年,馬氏相聲則傳承了134年。從我爺爺馬德祿起,就將“清門相聲”與“渾門相聲”兩大傳統風格融匯,形成了“清渾合流”,繼而影響到我父親馬三立,再傳到我這一輩。
“馬氏相聲”講究四個方面:內容“俗不傷雅”,說的是老百姓的事,但不粗俗低下;風格“謔而不虐”,善于諷刺,但點到為止;口味“咸淡見義”,既有知識性、思想性,又兼具娛樂性和市井煙火;表演“似我非我”,演員將人物演到骨子里,但又不完全代入自己。
我寫的《糾紛》這段相聲,就是個典型例子。有一次演出結束后,我前往治安派出所探望幾個和我相熟的民警,正好撞見兩個因為唾沫星子起了爭執的小伙子吵得不可開交,誰也不讓誰,最后被勸進屋冷靜。警察說:“你們先歇歇。”一頓茶水、一點時間,兩人也就各退一步了。
我當時在旁邊觀察,回家后一口氣把這個場景寫下來作為初稿。我將吐唾沫改成一個人推著自行車軋了對方的腳,后來幾番改寫,又到街頭體驗更多真實的爭執語言,設計角色的聲音差異——一個細聲尖氣,一個粗聲大嗓,又融合警察調解的智慧語言,才形成了今天觀眾熟知的《糾紛》。
馬志明(左一)接受中新社“東西問”專訪。 中新社記者 佟郁 攝
中新社記者:為什么說天津這座城市滋養了相聲?相聲又如何塑造了天津的文化氣質?
馬志明:天津是中西文化的交匯點,也是大運河與海河文化的交融地,五方雜處,語言豐富,人又愛“找樂”。我父親馬三立常說,他這一輩子堅持在天津演出,就是因為天津觀眾懂相聲、愛相聲,是“知音”。
觀眾的存在,促進了相聲的發展,也塑造了天津的語言生態。天津人說話幽默,飯桌上、課堂上都能“順嘴來一段”。這種文化氛圍,既是“熏”出來的,也是一代代演員、觀眾共同“磨”出來的。
過去很多觀眾不是來聽新段子的,而是幾十年如一日,聽“馬家的老活兒”。我印象最深的是一位老觀眾姜大爺,我父親的每一場演出他都來,姜大爺80多歲時還讓孫子推著車到劇院聽我父親說相聲。觀眾與演員之間的感情,早已超越了“買票與被取悅”的關系,成為一種文化上的共同體。
2017年2月11日,被譽為“天津第一茶館”的百年謙祥益文苑客座滿堂,許多市民及游客到此喝茶,聽相聲,感受天津“曲藝之鄉”的文化魅力。在百年綢緞老店謙祥益原址上建成的謙祥益文苑,有著“天津第一茶館”之稱,天津眾多相聲名家均在此演出。 中新社記者 佟郁 攝
中新社記者:傳統相聲如何適應當代快節奏的傳播語境?
馬志明:過去說一段相聲可能二十分鐘才抖出一個包袱,但觀眾照樣樂得不行。現在短視頻時代,有人希望“三秒一個包袱”,甚至剪輯成“包袱合集”。
但相聲真正的魅力不是在于“抖”多少個包袱,而在于“包”得巧不巧。“包袱”得有鋪墊、有語境、有節奏、有層次——好比吃包子,皮得發面,餡得合口,得先用一層一層的語境把它“包”起來,最后再揭開“底包袱”,觀眾才會覺得有回味、有驚喜。
要是一上來就抖包袱,就像把包子剝了皮、拎出一團餡往嘴里塞,吃著沒層次、也沒意思。好的相聲,得是熱騰騰一口咬下去,面香餡足、還得有點“湯汁兒”,才算過癮。
比如《五味俱全》,既保留了傳統相聲一貫講究的結構完整、節奏清晰和包袱設計的層層遞進,也加入了許多超出現實邏輯的幻想情節——五味大俠登上珠穆朗瑪峰、與“四大魔頭”斗法、將大鹽坨子一腳踢進太平洋,引出“海水為什么是咸的”這一荒誕設定。
這種充滿想象的段子在當時的相聲舞臺上幾乎沒有先例,很多人說它像“相聲里的漫威”。這個段子當時得到我父親馬三立的高度認可,他說“這段子將來我也想說”,還把戴了一輩子、刻著他名字的金戒指送給我以示鼓勵。
中新社記者:相聲的幽默邏輯能否跨越語言與文化邊界?
馬志明:喜劇各有各的打法,但從根子上講,幽默是共通的。相聲講“逗哏”與“捧哏”,日本漫才講“耍笨”與“吐槽”,其實邏輯結構非常相近。兩者都講究節奏和角色分工,目的都是“在對話中制造意外與笑點”。
但區別也很明顯。日本漫才更依賴快速節奏、直白的沖突輸出,而馬氏相聲更講究“鋪平墊穩”,從聊天中自然轉入段子。“聽似聊天,實為表演”。
我記得有一年,一位專門研究幽默文化的美國學者來到我們的小劇場里。他聽不懂中文,但還是笑了。他笑的不是語言本身,而是人物關系、語氣鋪墊、情緒轉折,那個“勁兒”他能感受到。這時候,語言真成了障礙嗎?我看不見得。
關鍵是要找到文化之間的“共情點”。比如家庭關系、代際沖突、小人物的無奈,這些全世界都懂。如果能在這些層面上講故事,相聲就有希望成為真正意義上的“中西共笑”的藝術形式。
當然,這對我們演員的要求也更高了。你得會講段子,也得明白別人的笑點在哪兒;你不能光想著輸出傳統,還得琢磨怎么“翻成別人聽得懂的邏輯”。這不是削足適履,而是文化互通的能力。
中新社記者:相聲如何在堅守傳統的基礎上煥發新生?
馬志明:當今時代對相聲來說既是挑戰也是機會。傳統段子不能變成“博物館里的文物”,也不能只靠“情懷”吃飯。相聲演員不能怕“改”,但也不能亂“改”。
一方面要“守”,守住基本功,守住語言邏輯,守住“說學逗唱”的根本;另一方面也要“變”,要會用現代的媒介語言、掌握跨界的創作方式。
讓我印象很深的一次,是和京劇演員王珮瑜合作《文圖會》。原本我以為相聲和京劇是兩條路,但沒想到這兩門傳統藝術合在一起,在舞臺上有一種出人意料的契合感。
這場演出的觀眾來自全國各地,還有從加拿大飛回來的。這讓我特別感慨:相聲的影響力,已不只是“北方的笑事兒”。有南方觀眾跟我說,雖然有些典故不熟,但聽著別致、新鮮,還很“解渴”。
2013年8月4日,首屆西岸·馬三立城市舞臺戲劇展在天津大禮堂啟幕,京劇界、曲藝界聯袂演出墨殼原態舞臺劇《烏盆記》,“少馬爺”馬志明(左一)親自掛帥飾演劇中人物,重現上世紀三十年代津門藝文原生態。 中新社記者 佟郁 攝
這類“跨界”,不是“為了混搭而混搭”,也不是追趕潮流,而是真正試圖探索傳統藝術的新邊界。你得先守住相聲的表演基礎、舞臺邏輯,再去嘗試與別的藝術門類合作,才能做到“合”而不“雜”。
最后,我希望觀眾們笑口常開、一順百順、多聽相聲。只要相聲還有人愛聽,它就能在新時代“活下去、火下去、傳下去”。(完)
受訪者簡介:
馬志明。中新社記者 佟郁 攝
馬志明,國家一級演員,國家級非物質文化遺產代表性項目(相聲)代表性傳承人。相聲泰斗馬三立長子,馬氏相聲的第三代傳人。
馬志明于1957年考入天津戲校學武花臉,1962年調入天津市曲藝團正式說相聲,1986年由相聲大師侯寶林代拉收為師弟,拜已故相聲前輩朱闊泉為師。馬志明自幼打下堅實相聲功底,深得“馬氏相聲”真髓,不僅繼承其父馬三立的文哏表演,更將武技融入相聲表演之中。代表作有《大保鏢》《報菜名》《數來寶》《歪唱太平歌詞》《糾紛》《夜來麻將聲》《核桃酥》《論拳》等。
【編輯:胡寒笑】 ...【知識】
閱讀更多利潤暴跌,手機沒人買:三星Galaxy S24 Ultra或將采用鈦合金
知識作為全球赫赫有名的數碼巨頭,三星電子今年可謂是慘淡經營。三星電子在7月27日公布的財報中表現可謂十分地糟糕,首先是公司的營業收入為60萬億韓元約合人民幣3364億元),同比下滑22.28%,而營業利潤 ...
【知識】
閱讀更多ChinaJoy 2023丨韶音展示OpenFit、OpenRun Pro 深挖不入耳耳機市場
知識在第二十屆中國國際數碼互動娛樂展覽會ChinaJoy 2023)上,我們再次看到老面孔——韶音,它展示旗下最新的OpenFit舒適圈和OpenRun Pro骨傳導運動耳機,繼續深挖不入耳耳機市場。Op ...
【知識】
閱讀更多
熱門文章
最新文章
友情鏈接
- “零接待”帶來的清風正氣
- 暴雨、大霧、強對流 中央氣象臺今晨三預警齊發
- 今年6月比什凱克平均氣溫打破歷史紀錄
- 7月2日央行開展985億元7天期逆回購操作
- 世衛組織報告聚焦“社會聯結” 天津專家獻策全球抗孤獨行動
- 匯聚起維護國家安全的強大力量——寫在國家安全法頒布實施十周年之際
- 中國—東盟人工智能創新合作中心系列項目投入試運營
- 長三角鐵路2025年上半年發送旅客逾4.55億人次
- 防范私域直播間誘導老年人買“神藥” 兩部門發布消費風險提示
- 治安管理處罰法 哪些修訂與你我密切相關
- 華為孟晚舟:鴻蒙一年走過其它系統十多年之路,紅楓影像源自東北
- 魅族Lucky 08榮獲2024五星獎年度編輯推薦獎
- CES 2025前瞻:AI風口下的中美科技角斗場
- 售價有望超過100萬?擲彈兵1924限量版明年上市
- 三星Galaxy S25系列官宣!1月23日凌晨2點發布,AI又升級了!
- 森海塞爾 HD 620S 封閉式耳機榮獲2024五星獎年度編輯推薦獎
- 奧尼NX5pro AI智能云臺直播攝像機榮獲2024五星獎年度編輯推薦獎
- 曝極越汽車正在返聘員工,夏一平稱不會放棄
- 2024年最后一周新勢力汽車品牌銷量:樂道發力進前十,小米排第七
- 1:1復刻日本Kcar?電動版五菱之光EV官圖發布