隨著大模型和空間計(jì)算的快速發(fā)展,數(shù)字人商業(yè)化已經(jīng)成為一個熱門領(lǐng)域。數(shù)字人是指通過計(jì)算機(jī)技術(shù)和人工智能技術(shù)生成的虛擬人物,可以模擬真實(shí)人類的外貌、語言和行為。百度數(shù)字人的核心團(tuán)隊(duì)由人工智能專家、計(jì)算機(jī)圖形學(xué)專家和語音識別專家組成,他們致力于研究如何將人工智能技術(shù)應(yīng)用于虛擬人物的創(chuàng)作和生產(chǎn)。
IXDC采訪到百度數(shù)字人與機(jī)器人業(yè)務(wù)負(fù)責(zé)人李士巖先生,就目前達(dá)模型浪潮下,數(shù)字人技術(shù)正在經(jīng)歷的變革、對我們生活和工作的影響、數(shù)字人領(lǐng)域的技術(shù)研發(fā)取得的重要成果等問題做出詳細(xì)的解答。
在當(dāng)前大模型和空間計(jì)算浪潮的背景下,數(shù)字人技術(shù)正經(jīng)歷著怎樣的變革?這些變革將如何影響我們的生活和工作
數(shù)字人跟空間計(jì)算主要帶來的場景變化主要是第一,基于大模型是集中在對數(shù)字人的底層能力所產(chǎn)生的資產(chǎn)的生成數(shù)字人的驅(qū)動,數(shù)字人的對話能力交互能力以及內(nèi)容生產(chǎn)的性能方面,帶來質(zhì)的變化。舉個例子,比如說原來要構(gòu)建一個2D的數(shù)字人,基于原來的做法訓(xùn)練時間要1-3天,但是現(xiàn)在基于我們視覺大模型的技術(shù),能夠5分鐘自動化的完成數(shù)字人的訓(xùn)練。在數(shù)字人的交互能力上,基于LRM自然語言的大模型,可以使得原來我們的對話能力是基于領(lǐng)域來分別訓(xùn)練和構(gòu)建的,然后需要的成本非常高。但是現(xiàn)在基于大模型的技術(shù),可以用很少的數(shù)據(jù)就能夠訓(xùn)練一個領(lǐng)域模型,且它的對話效果較原來呢也有一些質(zhì)的提升。
百度在數(shù)字人領(lǐng)域的技術(shù)研發(fā)取得了哪些重要成果?這些成果將如何推動數(shù)字人的商業(yè)化進(jìn)程
現(xiàn)在數(shù)字人或者說任何一個行業(yè)的商業(yè)化瓶頸,在需求極其豐滿的前提下,都是產(chǎn)品的交付效率和產(chǎn)品的成本?;谶@幾點(diǎn)的考慮,目前我們幾年的投入上面,第一是在這個數(shù)字資產(chǎn)的創(chuàng)建方面,我們使他原來的比如每做一個3D的超寫實(shí)形象,用傳統(tǒng)方式來做要幾萬到幾十萬不等。但現(xiàn)在我們在上面投入了很多,能夠就一些基礎(chǔ)的簡單的三維人像模型在超寫實(shí)維度,做到基于照片的自動化的生產(chǎn)以及基于產(chǎn)品的平臺化建設(shè),使他的交付效率,過往的數(shù)字人的很多企業(yè)的做法是要給企業(yè)交付,數(shù)字人要交付很多東西,然后有復(fù)雜的使用流程。那現(xiàn)在我們更傾向于將這些所有的產(chǎn)品能力,集成到一個標(biāo)準(zhǔn)化的像PPT、像word一樣易用的軟件當(dāng)中,來交付客戶來使用。比如在直播帶貨的這個領(lǐng)域,過往使用數(shù)字人直播帶貨的成本還是很高昂的,那現(xiàn)在基于大模型的基礎(chǔ),他只需要拿到一個標(biāo)準(zhǔn)化的軟件、文案,可以自動化的生成問答、可以自動化的生成數(shù)字人、可以自動化的生成一個基于數(shù)字人平臺的直播間,可能他只需要經(jīng)歷一小時的簡單培訓(xùn),有一個人他就能夠用這個產(chǎn)品來做直播帶貨。
數(shù)字人商業(yè)化在目前市場中的地位和前景如何?您認(rèn)為未來數(shù)字人的應(yīng)用領(lǐng)域有哪些可能性
數(shù)字人的商業(yè)化的發(fā)展速度非常非常的快,每年有很好的增長率,同時在數(shù)字員工、虛擬偶像、城市IP、企業(yè)IP等領(lǐng)域,我們也看到了非常大的市場空間,尤其是在虛擬偶像跟直播帶貨兩個賽道,我們看到都是接近百億級的市場空間,目前基于空間計(jì)算的發(fā)展,也為這幾個賽道帶來了新的機(jī)遇。因?yàn)榛诳臻g計(jì)算,里邊的不僅是三維的人,三維的空間和物體都要重構(gòu),來給人們帶來一個叫平面顯示計(jì)算設(shè)備完全不一樣的體驗(yàn),整體的體驗(yàn)提升是非常大的,數(shù)字人它本質(zhì)上還是計(jì)算平臺內(nèi)的一個交互載體或內(nèi)容載體,所以它的發(fā)展方向一定跟計(jì)算平臺的發(fā)展是息息相關(guān)的。我覺得大概是分為兩個階段。就第一階段基于大模型的發(fā)展它會讓數(shù)字人能有更好的對話能力、更低的內(nèi)容生產(chǎn)能力,甚至基于大目前的應(yīng)用來改變一些比如說直播帶貨,這個行業(yè)的一個叫生產(chǎn)關(guān)系,基于大模型會帶來一波增長,下一個階段就是基于空間計(jì)算平臺,我們相信,由于數(shù)字人是空間計(jì)算平臺,我們每個人進(jìn)入空間計(jì)算平臺里的一個基礎(chǔ)設(shè)施,是你的身份證、是你在里邊你的替身。所以我覺得基于空間計(jì)算平臺,里邊的從服務(wù)到內(nèi)容到我們自己的二分身的場景,都會非常大的市場增長空間。
0人打賞
機(jī)構(gòu)簡介
百度數(shù)字人與機(jī)器人業(yè)務(wù)負(fù)責(zé)人,管理業(yè)務(wù)的產(chǎn)品研發(fā)、運(yùn)營和商業(yè)化。深耕大模型和空間計(jì)算相關(guān)應(yīng)用,是常年奮戰(zhàn)在業(yè)務(wù)一線的人工智能標(biāo)桿產(chǎn)品領(lǐng)導(dǎo)者。曾任職百度人工智能交互設(shè)計(jì)院架構(gòu)師和人機(jī)探索實(shí)驗(yàn)室負(fù)責(zé)人,北京郵電大學(xué)企業(yè)導(dǎo)師、中國服務(wù)設(shè)計(jì)十大青年,具有50+項(xiàng)專利、10+篇論文。
這里擁有全球領(lǐng)先的用戶體驗(yàn)創(chuàng)新知識。全網(wǎng)獨(dú)家,更權(quán)威,更全面。
每一年,來自全球領(lǐng)先企業(yè)的專家、CEO們都給我們分享最成功的案例、方法與前瞻觀點(diǎn)。幫助數(shù)以萬計(jì)的從業(yè)者們解決產(chǎn)品、設(shè)計(jì)、運(yùn)營、技術(shù)、管理等5大內(nèi)容類別的困惑與瓶頸。在這里,你可以觀看500+國際體驗(yàn)設(shè)計(jì)大會高清權(quán)威視頻課程。
IXDC帶你建立全球視野與能力,解決專業(yè)困惑與職場瓶頸,足不出戶汲取讓你成長的海量知識。聯(lián)系在線客服:18826260168