2025年產(chǎn)業(yè)規(guī)模將突破500億,站在“風口”的“數(shù)字人”是什么人?
2025年,北京市數(shù)字人產(chǎn)業(yè)規(guī)模將突破500億元?!皵?shù)字人”到底是什么人?數(shù)字人有什么用?未來可能面臨哪些倫理和法律問題?
撰文/記者 段然 編輯/吉菁菁 圖源/視覺中國(除署名外)
采訪專家:
沈 陽 (清華大學新聞與傳播學院教授、“元宇宙文化實驗室”主任)
唐佳嫻 (數(shù)字王國集團虛谷未來科技(北京)公司CEO)
“大家好,我叫班長小艾,是少兒知識分享官,平時我會給小朋友分享非常有趣的科普知識、童話故事和兒童玩具等等!”一個表情靈動、清純可愛的少女形象出現(xiàn)在大屏幕上,她用清純甜美的聲音向著屏幕外的觀眾揮手致意并做著自我介紹,還時不時擺動著紗制的裙擺,自信地展示自己曼妙的身姿。
▲超寫實虛擬數(shù)字人小艾(供圖/虛谷未來科技)
這個名叫“班長小艾”的恬美少女,并不是真實的人類,而是元宇宙空間中眾多虛擬數(shù)字人之一。她不僅從眼神表情到動作舉止都做到了活靈活現(xiàn),甚至連衣服的材質(zhì)細節(jié)都能夠完美呈現(xiàn),最重要的是,她能與真實的人類進行順暢交流?!拔覀兛梢院退M行實時互動,比如向她進行提問或進行其他形式的一些游戲等。”小艾的制造者,數(shù)字王國集團虛谷未來科技(北京)公司CEO唐佳嫻介紹說。
“小艾,你最擅長什么呀?” 記者提了一個開放式的問題。
“成語接龍!你要不要來比試比試?” 小艾不僅回應了記者的提問,還微笑著向記者發(fā)起了挑戰(zhàn)。這一瞬間,這個原本由數(shù)據(jù)代碼構成的虛擬形象,似乎擁有了現(xiàn)實世界真實人類擁有的真情實感。
對于那些有志于在數(shù)字人產(chǎn)業(yè)這條全新賽道上發(fā)力的企業(yè)而言,這部國內(nèi)首個數(shù)字人產(chǎn)業(yè)專項支持政策無疑是一次極大鼓舞,但對于接觸過虛擬數(shù)字世界但卻涉獵不深的普通人而言,計劃中反復提到的“數(shù)字人”這個概念,就顯得既熟悉又陌生。
▲2022年9月1日,北京,參觀者在中國國際服務貿(mào)易交易會首鋼園展區(qū)拍攝由真人控制的虛擬數(shù)字人表演
▼▼▼
“虛擬人”“數(shù)字人”“虛擬數(shù)字人”都是什么人?
元宇宙空間內(nèi),除“數(shù)字人”之外,還活躍著“虛擬人”“虛擬數(shù)字人”,這些容易混淆的概念不禁讓人心生疑惑:這三者之間有什么聯(lián)系和區(qū)別嗎?
2022年1月22日,天風證券發(fā)布互聯(lián)網(wǎng)傳媒行業(yè)深度報告《虛擬數(shù)字人:元宇宙的主角破圈而來》中指出:“虛擬人、數(shù)字人、虛擬數(shù)字人的目標是通過計算機圖形學技術 (Computer Graphic,CG)創(chuàng)造出與人類形象接近的數(shù)字化形象,并賦予其特定的人物身份設定,在視覺上拉近和人的心理距離,為人類帶來更加真實的情感互動。按照各定義特征的要求,數(shù)字人的范疇包含虛擬人,虛擬人的范疇包含虛擬數(shù)字人?!?/p>
“其實目前在行業(yè)內(nèi),對‘數(shù)字人’‘虛擬人’和‘虛擬數(shù)字人’ 這些概念,并沒有明確的辨析和權威的解釋。我們一般認為虛擬數(shù)字人或數(shù)字人是比較準確的說法?!鼻迦A大學新聞與傳播學院教授,長期從事 AI 和大數(shù)據(jù)、元宇宙與虛擬數(shù)字人等領域研究的沈陽對記者解釋道。廣義來看, 用動畫制作等各種或傳統(tǒng)或現(xiàn)代的手段創(chuàng)造出來、在真實世界不存在的形象,都可以統(tǒng)稱為“虛擬人”,而“數(shù)字人”通常是運用三維建模等數(shù)字化手段制作而成的。對于不要求必須具備交流互動能力時, 數(shù)字人、虛擬人、虛擬數(shù)字人這三者概念可以認為是等同的。但在嚴格意義下它們又有細微差別,正如天風證券發(fā)布報告中所說:虛擬人的身份是虛構的,現(xiàn)實世界中不存在;數(shù)字人強調(diào)角色存在于數(shù)字世界;虛擬數(shù)字人強調(diào)虛擬身份和數(shù)字化制作特性。
其實,從歷史角度來看,虛擬人在某種程度上,更像是數(shù)字人的先聲或者早期形態(tài)。在數(shù)字制作手段出現(xiàn)和推廣之前,虛擬人這個概念就已經(jīng)活躍在二維構建的世界中了。
早在上世紀80年代,得益于動漫產(chǎn)業(yè)的飛速發(fā)展,日本將當年大賣的動畫片《超時空要塞》和《太空堡壘》中出現(xiàn)的宇宙歌姬林明美進行一系列包裝,并以虛擬歌姬的身份成功出道,還發(fā)行了音樂專輯。同時,英國也創(chuàng)作出了一個名為Max Headroom的男性虛擬演員。然而,這些早期虛擬人在先聲奪人后,卻并未在相應技術的支撐下發(fā)展下去。
無論是林明美還是Max Headroom,這些頗具科幻色彩的虛擬形象,卻都是由手工繪制或者真人特效化妝這類相當原始的手段來實現(xiàn)的。對比真實世界里的人,這類早期虛擬人更像是二維動畫的衍生品,并沒有給人們帶來多少沖破現(xiàn)實的科技感。
直到信息時代來臨,以CG和動作捕捉技術為代表的虛擬技術得到廣泛應用,虛擬人才終于插上了數(shù)字化的翅膀,從古板的二維手繪動畫跨入了三維建模世界中,得到了更加立體更貼近真人的呈現(xiàn),并最先出現(xiàn)在電影銀幕上那些華彩玄奇的科幻鏡頭中。
比如我們熟知的《魔戒》中的咕嚕、《哈利·波特》系列電影中的小精靈多比,《加勒比海盜》中的章魚人等虛擬形象,都是通過捕捉和采集真人身上的動作與表情,通過CG后期處理和渲染,在視覺上讓那些精靈怪獸獲得和真人一樣的表現(xiàn)力,以滿足觀眾對“逼真”效果的追求。
除了形象與動作逼真外,隨著AI技術與深度學習算法技術的興起,虛擬人又被進一步賦予了智能化的內(nèi)涵,除了模仿人類的行為外,還獲得了與真人交互的能力。技術迭代發(fā)展到這一步,無論是虛擬人、數(shù)字人還是虛擬數(shù)字人,這些概念實際上已經(jīng)難分彼此:誕生于數(shù)字世界的人物,從制作技術上而言可以被稱為“數(shù)字人”,同時,相對于真實的物理世界,數(shù)字世界也是虛擬的存在,存在于這個世界的數(shù)字人也是“虛擬人”。
相對于學界對學術概念探究的細致入微,產(chǎn)業(yè)界則往往是實踐先行,“無論是虛擬人還是數(shù)字人,只是叫法不同而已,本質(zhì)上是概念的區(qū)分,而非純技術領域的差別?!碧萍褘拐f。
▼▼▼
從活靈活現(xiàn)到真假莫辨,
虛擬數(shù)字人是怎樣煉成的?
本質(zhì)而言,虛擬數(shù)字人其實就是對真人的一種模擬形態(tài),在具體制作過程中,數(shù)字人需要以人的各個位面作為參照,做到形神兼?zhèn)洌拍艹尸F(xiàn)出“人”的效果。人是兼具自然屬性和社會屬性的存在,數(shù)字人首先要從模仿人的自然屬性入手,這里既包含了人的身體,也囊括了人的思想。
身體是人存在的物質(zhì)基礎,模擬真人身體是呈現(xiàn)虛擬人效果的第一步。在這里,技術人員需要依靠一系列復雜的建模技術來實現(xiàn)虛擬數(shù)字人從靜態(tài)到動態(tài)的躍遷。
首先要對人的靜態(tài)身體進行建模,目前業(yè)界最廣泛的應用方式是通過3D建模軟件塑造出人的靜態(tài)3D模型,實現(xiàn)各種高低細節(jié)效果??紤]到人體外形本身就是復雜的不規(guī)則體,肢體活動又復雜多變,這種方式非常考驗建模人員的經(jīng)驗與手感,人工建模的效率是不可控的。因此,在3D建模之外,近年來又逐步興起了儀器采集建模和自動化建模這兩種新方法,前者是通過儀器掃描的方式來將采集的人體信息轉換為數(shù)字信號,完成人物的幾何建模。后者則通過一套AI系統(tǒng)來直接生成人體結構。這兩種新方式都極大降低了建模的時間成本,使虛擬數(shù)字人的大規(guī)模生產(chǎn)成為可能。
有了靜態(tài)的人體,如何讓人體各部位活動起來,賦予虛擬數(shù)字人生命的氣息?
第一步是要進行骨骼綁定,即在虛擬數(shù)字人身體上涉及基本活動的關鍵部分進行打點,大到骨骼、關節(jié),小到眉毛、眼角,這些遍布全身的“點”將成為驅動虛擬數(shù)字人做出各種動作與表情的關鍵。
第二步就是在綁定基礎上,讓虛擬數(shù)字人真正動起來,現(xiàn)在更多的是靠驅動技術來控制動作和表情,根據(jù)外界的信號來實現(xiàn)實時反饋。這就需要通過一系列復雜的動作捕捉技術來捕捉真人動作細節(jié),將之賦予虛擬數(shù)字人,實現(xiàn)從“靜”到“動”的效果。
當然,無論在技術上將虛擬數(shù)字人的身體做得多么惟妙惟肖,缺少了頭腦就只能作為一只高科技的提線木偶而存在。這就要賦予虛擬數(shù)字人真人一樣的“靈魂”,借助各種復雜的當代人工智能技術(比如計算機視覺技術、語音識別與合成技術等),人們能夠使數(shù)字人獲得看到、聽見、說話等基礎感知,在此基礎上還能獲得一定的認知、判斷甚至創(chuàng)造能力。
隨著技術的不斷突破,未來的數(shù)字人將具備更為復雜的思想,更為擬人的性格,甚至與人類產(chǎn)生共情,從單純的活靈活現(xiàn),變得真假莫辨。
▼▼▼
“舉杯邀明月,對影成三人”,
虛擬數(shù)字人有什么用?
如果算上二維動畫時代創(chuàng)造的那些古早味虛擬形象,數(shù)字人整個發(fā)展歷史不過40年。
實際上,發(fā)揮自己的想象,在現(xiàn)實世界中創(chuàng)造出一個虛擬的人,這種想法其實早在古代就出現(xiàn)在當時人們的腦海中。
比如唐朝詩人李白的“舉杯邀明月,對影成三人”,在明月和自己之外,這位大詩人又將自己的影子想象成一起開懷暢飲的友人,如此詩境,令人陶醉。
“其實人類一直都希望在思想世界中呈現(xiàn)出數(shù)字人?!?沈陽對記者說道,“如果要把‘對影成三人’這種場景具象化,表現(xiàn)詩人的這樣一種藝術境界,在現(xiàn)代我們就需要借助數(shù)字人來實現(xiàn)。”
可以想見,倘若李白活在當代,在現(xiàn)實世界深感 “花間一壺酒、獨酌無相親”的孤寂時,他可以與數(shù)字人一同把酒言歡,一起寄情山水,一塊兒暢談古今,這個虛擬數(shù)字人可以通過AR方式呈現(xiàn),依靠CG渲染技術表現(xiàn)出與真人一樣的外形與動作,通過AI技術獲得與人交互的能力,最大程度上滿足了李白“以酒會友”的需求—而這其實正體現(xiàn)了數(shù)字人當前最廣泛的應用場景:承擔人類在真實世界中的部分工作。
“虛擬數(shù)字人第一個生產(chǎn)力的體現(xiàn),就是替代人在真實世界中創(chuàng)造精神世界的一部分勞動。” 沈陽概括,“比如電影本身就是一個精神世界的產(chǎn)品,未來獲得演員授權的數(shù)字人可以替代一部分表演工作?!弊鳛閿?shù)字人最早發(fā)軔的應用場景,當下的電影制作中,以CG技術創(chuàng)造的高寫實人物或虛擬角色已經(jīng)廣泛應用于后期特效,可以呈現(xiàn)真實世界中無法企及的炫酷大場面。而在未來,AI技術加持下的數(shù)字人演員可能會在相當程度上替代真人演員的工作,從而極大降低電影全周期的制作成本。而在唐佳嫻看來,虛擬數(shù)字人最早出現(xiàn)在電影《返老還童》中,替代真人演員無法拍攝的工作任務。后來延至逝者復活,乃至“虛擬偶像”的創(chuàng)造及商業(yè)發(fā)展。而在當前,通過AI的加持,虛擬數(shù)字人可以替代一些重復性、功能性的真人服務,甚至能實現(xiàn)“一對一”的貼身虛擬陪伴服務。
▲在江蘇衛(wèi)視今年年初的跨年演唱會上,通過數(shù)字技術“復活”的一代歌星鄧麗君登臺獻唱,驚艷世人 (供圖/虛谷未來科技)
目前虛擬數(shù)字人早已從影視制作和游戲中走出來,不斷嵌入到現(xiàn)實世界生活的方方面面?!氨热缣摂M偶像、虛擬明星、虛擬主播和主持人,這些都是偏娛樂方向的。另外,目前出現(xiàn)的虛擬老師、虛擬導游、虛擬解說等等,則是偏服務方向的。 ”唐佳嫻介紹說。
在主播經(jīng)濟浪潮的推動下,不少虛擬數(shù)字人已進軍主播或主持行業(yè),與真人或相互合作,或同臺競技。
▲2021年,虛擬美妝博主“柳夜熙”橫空出世 , 一夜之間在短視頻平臺吸粉百萬
在計算機技術的加持下,目前虛擬數(shù)字人的制作已經(jīng)實現(xiàn)了從建模、驅動、渲染、剪輯和合成等生產(chǎn)步驟的實時化和智能化產(chǎn)出,就如同流水線上的產(chǎn)品一樣能夠大規(guī)模生產(chǎn),雖然在語言、動作等方面的精細程度上存在很多短板,但相比真人主持與主播,虛擬數(shù)字人卻有更寬廣的發(fā)揮空間:他們可以以卡通萌寵的形象示人,也可以是根據(jù)真人主播真身復刻的數(shù)字分身,同時也可以是在真人基礎上進行藝術創(chuàng)作的超寫實形象(文章開頭提到的小艾,就屬于超寫實虛擬數(shù)字人),在降低制作成本的同時,極大拓展了內(nèi)容創(chuàng)作的想象空間。
除此之外,數(shù)字人也在相當程度上開始參與現(xiàn)實世界的服務工作中,從偶像、主播等遠在云端的娛樂領域,向日常生活中的老師、咨詢專家、導游等服務類角色不斷貼近,并進一步開始擔負起普通人的日常陪伴工作,實現(xiàn)人類社會復雜而敏感的情感寄托。
沈陽所領導的清華大學元宇宙文化實驗室不僅是國內(nèi)高校最早一批成立的元宇宙實驗室,更是國內(nèi)首個帶有文化屬性的元宇宙實驗室,其科研團隊目前也在朝著這個方向重點攻關:“我們研究成果的重點應用場景之一就是把過世親人以虛擬數(shù)字人形式還原出來,讓他們以數(shù)字生命方式重獲新生?!?可以想見,這種數(shù)字人的呈現(xiàn)方式,對于思念逝者的人而言,將是一種莫大的精神撫慰。而“代碼為骨、渲染為皮”的數(shù)字人,未來或許會成為整個人類社會不可或缺的參與者。
▼▼▼
虛擬數(shù)字人和元宇宙是何種關系?
無論是娛樂方向的虛擬主播或偶像,還是服務日常生活和情感照顧的虛擬老師、專家等,無論這些數(shù)字人制作得多么惟妙惟肖,多么靈動活現(xiàn),在AI技術加持下多么伶牙俐齒,但終究還是停留在“讓他們介入到我們的世界”這一方式上。而我們知道,數(shù)字人誕生于平行于現(xiàn)實的虛擬世界中,如果我們把方向逆轉,跟著數(shù)字人的腳步,探訪他們所處的世界,將會是一種怎樣的體驗呢?
這就不得不提近來被持續(xù)熱議的新概念—元宇宙。這個整合了多種互聯(lián)網(wǎng)技術而形成的虛擬社會形態(tài),在登上舞臺之初,就與數(shù)字人有著千絲萬縷的淵源。
1992年,美國著名的賽博朋克流科幻作家尼爾·斯蒂芬森在其作品《雪崩》中首次提到了元宇宙概念,同時也在小說中提到了名為Avatar的虛擬化身概念,可以理解為一種虛擬數(shù)字人。在小說構建的數(shù)字空間元宇宙中,人們通過各自的“Avatar”化身沖破地理阻隔,相遇并交往。而在當下學界和產(chǎn)業(yè)界努力推動和構建的元宇宙世界中,虛擬數(shù)字人就是人類接觸元宇宙的最基本方式和抓手。
▲元宇宙以5G/6G、云計算、區(qū)塊鏈、大數(shù)據(jù)等為底層支撐,并以人工智能、數(shù)字孿生、VR/AR 等為映射、動力與通道,同時融合人的思維意志、情感想象等主觀意識,連接了物理世界與數(shù)字世界,形成虛實共生的“新世界”(圖片來源 /《元宇宙——概念研究與體系構想》
“我們構建一個元宇宙空間,這個空間做得好與不好的標準,不在于本身做得有多仿真,而是在于我們?nèi)祟惸懿荒艹两谶@個虛擬場景中,產(chǎn)生一種共情。而這就需要借助虛擬數(shù)字人”,沈陽這樣解釋數(shù)字人與元宇宙之間存在的高度關聯(lián)性。
所謂人是宇宙的主體,映射到元宇宙的世界也是如此—數(shù)字人才是元宇宙的主體。在沈陽看來,除了能在真實世界替代人去創(chuàng)造精神世界的產(chǎn)品,元宇宙中的數(shù)字人同樣能在元宇宙中替代人的數(shù)字勞動,“比如你在元宇宙中參加一個虛擬會議,會上的一些儀式性的工作就可以交由數(shù)字人來承擔,這也是他生產(chǎn)力的體現(xiàn)?!?/p>
唐佳嫻則認為:“元宇宙實際上就是一個數(shù)字化空間,構成這個空間的三要素就是:人、物、場。”在她看來,人就是數(shù)字人,物是存在于元宇宙中的各種物品,場就是元宇宙生態(tài)中構建起的各種場景及其關系。而其中“人”是主角,元宇宙中的“物”和“場”是以人為中心,為“人”服務的。
作為現(xiàn)實世界的映射,元宇宙絕非真實世界一比一的復刻,而是以數(shù)字化和網(wǎng)絡的方式,呈現(xiàn)另一種環(huán)境生態(tài)的平行世界。存在于這個世界的數(shù)字人,除了具備人的形象,還需要有“人”的性格、行為特征,更重要的是要有人的交互能力。
這其實很容易聯(lián)想起那些經(jīng)典的網(wǎng)絡游戲的內(nèi)在邏輯—你以某個虛擬角色身份參與到具體場景中,以真人驅動的方式操縱場景中的虛擬數(shù)字人,和場景中其他或真人驅動或AI驅動的角色進行互動。只是在元宇宙生態(tài)中,你不再是單純圍繞游戲的故事劇本推進劇情走向,只是和那些不同的數(shù)字人進行組隊或者相互戰(zhàn)斗,而是和他們產(chǎn)生一系列復雜的社會交往行為,比如逛街、購物、看展出、郊游等等。元宇宙里的虛擬數(shù)字人就相當于真人在虛擬世界里的一個數(shù)字分身。
“人們在現(xiàn)實生活中只能做自己,但人本身是有實現(xiàn)多元性的夢想和需求的,在虛擬世界里普通人可以穿越多維時、空做不一樣的多元自我,體驗豐富奇幻的生活與世界?!碧萍褘拐f。
▼▼▼
虛擬數(shù)字人面臨哪些倫理和法律問題?
所謂有人的地方就有江湖,有江湖的地方就有恩怨。無論是有數(shù)字人參與的現(xiàn)實社會,還是以數(shù)字人為主體的元宇宙社會,都無可避免地會遇到矛盾與沖突,也就必然會涉及到各種各樣的問題。
首先是身份問題,每個現(xiàn)實中的人在介入元宇宙的世界中時都擁有屬于自己的數(shù)字身份識別,但這套身份識別不是現(xiàn)實世界中的身份證、護照等具體的證件,也不是社交網(wǎng)絡上的ID號碼。
“在元宇宙中,數(shù)字身份的具象化就是數(shù)字人。”沈陽解釋道,“元宇宙時代,我不再通過具體的ID號來識別你,而是通過虛擬數(shù)字人的形貌特征來識別你,形貌背后映射的是唯一的數(shù)字編碼,這就是DID(Decentralized Identifier),即分布式數(shù)字身份?!?而分布式數(shù)字身份當下也面臨著數(shù)據(jù)安全和網(wǎng)絡安全等挑戰(zhàn),背后也牽涉到個人隱私和倫理道德等一系列問題。
其次,無論是現(xiàn)實世界還是元宇宙,社會想要穩(wěn)定運行,就需要有相應的秩序,而秩序背后則需要有法律法規(guī)作為支撐。
數(shù)字人形成時間并不長,元宇宙更是一個全新的概念,但發(fā)展到現(xiàn)在已經(jīng)開始出現(xiàn)相應的法律問題,比如在2021年,元宇宙概念剛剛興起的時候,就出現(xiàn)了女性用戶在虛擬世界中受到騷擾,而引發(fā)法律訴訟的事件。而在今年年初,我國互聯(lián)網(wǎng)信息辦公室就頗具前瞻性地發(fā)布了《互聯(lián)網(wǎng)信息服務深度合成管理規(guī)定》(征求意見稿),對于數(shù)字人可能涉及的違法和侵權認定,做了初步的法律探索。
“雖然只是征求意見稿,但這顯然是一個非常超前的管理規(guī)定。雖然目前數(shù)字人還不普及,但相應的法規(guī)需要跟上?!?沈陽表示。
盡管有來自倫理、法律和制度層面的隱性挑戰(zhàn),但目前面臨的主要問題還是來自技術層面。
唐佳嫻認為,當下來看,虛擬數(shù)字人無法完全替代真人的全部工作,綜合體驗感還有待提升。不過對于數(shù)字人的未來,她依然非常樂觀:“我相信在未來,數(shù)字人能夠實現(xiàn)快速生產(chǎn),同時隨著AI技術的不斷更新,虛擬數(shù)字人的形象和思維學習都會飛速發(fā)展,相應的制作成本也會持續(xù)降低。”
“我國虛擬數(shù)字人的底層制作引擎目前看仍有待加強。”沈陽表示,“AI技術是虛擬數(shù)字人的靈魂,理論與技術上需要更多的創(chuàng)新?!?對數(shù)字人的未來,沈陽也充滿了期待:“我國數(shù)字人的應用場景十分豐富,在直播帶貨和短視頻等領域位居世界第一,同時擁有相應的產(chǎn)業(yè)政策作支撐,此外還有深厚的傳統(tǒng)文化作為依托,中國未來的虛擬數(shù)字人發(fā)展將別具特色?!?/p>