簡單卻困難：Animoji背后十年的技術難題

2017-10-26 09:54:22 閱讀 236577 本文來源：威鋒網(wǎng)

分享至：

表情隨心變

雖說 iPhone X 確實是一款極具誘惑力的新手機，它靚麗的外形和先進的技術很讓人驚艷，但畢竟很多東西我們都已經(jīng)通過爆料提前知道了。如果要說稱得上驚喜的，那么 Animoji 動畫表情功能應該算是其中之一了吧。

所謂的 Animoji 其實很簡單，就是讓手機屏幕中虛擬形象的臉隨你的變化而變化。你擺出什么夸張的表情，它也會跟著“模仿”。蘋果首批提供了 12 種卡通形象，無論是貓、狗、機器人、外星人還是便便，你都可以對著手機做做鬼臉，看看它們會有什么相應的變化。

別看功能好像很簡單，Animoji 還必須要 iPhone X 才能夠實現(xiàn)。因為我們知道，iPhone X 的前置攝像頭是所謂的“原深感攝像頭”，它能夠通過將數(shù)萬個光點投射到用戶臉上，實時捕捉他的 3D 面譜。通過這些面部信息，設備得以讓虛擬形象即時表現(xiàn)出和用戶相似的表情來。

蘋果會在發(fā)布會主題演講中重點提及 Animoji，肯定是因為對它有頗多期望。有趣的是蘋果說來很輕松，其實要真正實現(xiàn)它，是需要很長時間的技術沉淀的。那么有關 Animoji，這背后又有些什么值得我們?nèi)チ私獾募夹g細節(jié)？

一切的開始

早在幾年前，蘋果就已經(jīng)開始在收購很多相關的公司了，比如 Perceptio、Metaio、Faceshift，還有市場里最好的 3D 傳感器制造商之一 —— PrimeSense。雖說現(xiàn)在我們都已經(jīng)知道蘋果這些收購的目的了，但在當時它究竟想做什么，人們還是猜不透的。正是這些收購，讓 Animoji 最終得以實現(xiàn)。但是如果要了解它的技術起源，那就是十多年前的事情了。

在過去面部捕捉還是一項很費勁的工作，雖說好的科幻電影、CG 電影都已經(jīng)實現(xiàn)了細膩逼真的虛擬表情，但那需要演員在臉上粘上好多個追蹤器。隨著演員面部表情的變化，追蹤器的位置也會相應發(fā)生變動，讓光學系統(tǒng)能夠追蹤到，并根據(jù)這些數(shù)據(jù)構建表情變化的信息近似值，最后生成建模，然后手工調(diào)整修正。這種方法清晰、明了、有效。

但是它的缺點也非常明顯，那就是費時費力費錢，需要攝影棚環(huán)境，演員還得愿意使用這些追蹤器，穿上專門的動態(tài)捕捉服。這一切的不便，促使人們想要尋找更輕松簡單的面部捕捉的辦法。事實上從那個時候開始，研究者們就已經(jīng)想到深度感應攝像頭了。直到現(xiàn)在，這種技術都是最可行的解決方案，就像 iPhone X 那樣。

然而問題就在于它說起來簡單，其實很困難。我們雖然可以用各種簡單的詞語來描述人的表情，但每一個表情事實上都牽涉到臉部許多部位的活動，而且這些位移還是時刻在變化的。對計算機來說，要判斷這些位移數(shù)據(jù)究竟意味著什么，這可非常復雜。

為什么這會那么復雜？因為盡管人的臉對我們來說，無論怎么看都是一張臉，但對機器來說，它的算法涵蓋面要足夠廣，以至于無論角度變化，光線變化，年齡變化，民族變化，這等等所有的變數(shù)，系統(tǒng)都要能夠認出來這是人的臉，而且還要認得出他當時的表情。即使當技術進步，深度感應攝像頭已經(jīng)足夠復雜，能夠采集所有和臉部相關的重要信息之后，讓計算機讀懂這些信息還是十分困難，因為對計算機來說，這些數(shù)據(jù)本質(zhì)上什么意義都沒有。

轉變思維

為了解決這個棘手的難題，研究者們改換了思路。他們不再試圖讓計算機去強行讀懂那些紛亂的數(shù)據(jù)，而是為它設置了許多模板作為范本。

據(jù)了解在新的思路的指導下，科學家逐漸將面部識別視為了一種幾何問題。他們通過一系列面部數(shù)據(jù)和表情數(shù)據(jù)，訓練算法，讓它們建立多個可以去描述的靜態(tài) 3D 模型。這些信息，同樣也包含了民族差異和環(huán)境差異。有了這些計算模型，算法就可以更輕松地將掃描到的 3D 點陣面譜和實際的面部表情聯(lián)系起來，最終實現(xiàn)幾乎實時地將它反映在虛擬形象臉上。

看似簡單的技術，其實從提出概念到最終解決問題，其實已經(jīng)花去了十來年的時間。長時間以來，面部識別生成虛擬表情的技術的主要用戶是視覺特效公司，用來簡化他們的制作流程。然而隨著技術的進一步發(fā)展，我們已經(jīng)看到了諸如 Facerig 這樣，它得到的更為廣泛的應用。隨著蘋果推出 Animoji，我們可以想見這種技術的認知度將會更高。

從發(fā)布會上的演示中，我們就能夠看到面部表情捕捉的有趣之處。不僅僅是 Animoji，還有 AR 技術的應用也為 iPhone 帶來了新的玩法。蘋果高管在主題演講中演示了能夠貼合人臉部的虛擬面具，沒有 iPhone X 的原深感攝像頭和過去的技術積累，那是做不到的。

未來的前景

Animoji 將來能夠被我們用來做什么呢？喜歡玩兒的朋友們肯定已經(jīng)有了自己的計劃。它可以用虛擬形象還原我們的表情，并且還能錄下我們的聲音，通過 iMessage 發(fā)送出去。朋友們聽著我們的聲音，看到的確實是搞笑的卡通人物，那感覺肯定非常有趣。

如今的蘋果非常重視社交平臺和體驗的打造，了解人們對自拍和即時通信的需求，而 Animoji 在傳統(tǒng)的社交溝通體驗之上，增加了新的趣味。更重要的是，這些技術潛力無限。

據(jù)了解，面部表情模仿僅僅是個開始，現(xiàn)在業(yè)界希望能擴展這個技術，實現(xiàn)基于一張照片打造出真實度極高的虛擬形象，甚至達到能讓人誤以為是真人在說話和做出表情的程度。

如果蘋果也在朝著這個方向發(fā)展，這并不是什么讓人奇怪的事情。取代指紋識別后，面部識別系統(tǒng)毫無疑問將會是未來很長一段時間的主流配置。隨著手機性能的不斷增強，采用面部識別能夠做的事，能夠創(chuàng)造出的虛擬實體也就越來越復雜多樣。Animoji只是開了一個頭，誰知道以后在此之上它會發(fā)展出什么更加黑科技的東西呢？

責任編輯：mr

分享至：

拓展閱讀

29:03

共鳴設計——科學與審美的交匯，以Xiaomi SU7設計為例

李田原

小米汽車設計總監(jiān)

01:05:04

簡單卻困難：Animoji背后十年的技術難題

拓展閱讀

共鳴設計——科學與審美的交匯，以Xiaomi SU7設計為例

設計論文寫作：如何將實踐案例轉換為可發(fā)表的文本

2024產(chǎn)品設計專業(yè)系統(tǒng)化能力提升課程

2024體驗設計專業(yè)系統(tǒng)化能力提升課程