全國信息學奧林匹克競賽冬令營金牌,簽約北京大學計算機系,24歲的胡雅婷,和她的清北團隊即將上線D模型,建造屬于他們的4D世界。

  “不能和成熟的創(chuàng)業(yè)者競爭偏傳統(tǒng)或較成熟的AI領域,你肯定卷不過他們?!盇VAR AI公司創(chuàng)始人胡雅婷說道。在她看來,年輕的創(chuàng)業(yè)者得做下一個模態(tài)的技術,挖掘新生代用戶的需求和場景,這是00后的優(yōu)勢。

  相比大多數AI賽道的00后創(chuàng)業(yè)者,胡雅婷略顯“成熟”。2021年,她就創(chuàng)立了AVAR AI公司,堅定入局了3D應用場景,成為頭部的元宇宙數字品牌,和多家動畫、品牌、大廠合作。

  胡雅婷很喜歡皮克斯,這家傳奇的動畫公司,是她創(chuàng)業(yè)路上的標桿。當AI科技評論問她:“決定創(chuàng)業(yè)的那一天,是怎樣的一天?”她說不上來,好像和往常沒什么區(qū)別。

  當然,皮克斯的故事并不是從創(chuàng)立那天開始的,AI創(chuàng)業(yè)公司的故事也很少是這樣的。對于胡雅婷來說,最初的火花只是畫畫、一本書和一個校園的機房。

  從信息學競賽、北大計算機系再到頭部大廠的實習,一步步踏進信息學這個龐大的“帝國”。在Google、阿里等大廠的實習經歷,讓她逐漸發(fā)現整個互聯(lián)網的流量已經到頂了,只能做一些微小的優(yōu)化,從此埋下了創(chuàng)業(yè)的種子。

  相比成熟的連續(xù)創(chuàng)業(yè)者,她和團隊找到了自己的優(yōu)勢。3D和4D領域的競爭格局在國內外都還沒有形成,每天都有新技術出現。她坦言,即使在大廠有再多的AI經歷的創(chuàng)業(yè)者,大家也都是從全新的起點去探索。

  今年5月AVAR AI公司推出了Unique3D算法及新產品Aiuni AI,只需上傳一張圖片,就能在30秒內生成高精細度和還原度的3D模型,Unique3D上線后就登上了 Huggingface的熱門模型排行榜。

  目前,Aiuni AI的用戶主要為專業(yè)化用戶和平臺愛好者。接下來他們會更聚焦在動畫領域,關注創(chuàng)作者的生態(tài)。她發(fā)現,在各類AI賽道的生態(tài)當中,國內用戶的創(chuàng)造性和供應能力都更略勝一籌。

  構建平臺的核心壁壘,她認為不完全是靠某一個技術或者功能點,核心是要形成創(chuàng)作者的生態(tài),通過訂閱者和IP授權,從而形成創(chuàng)作者的經濟。

  Aiuni AI產品留下了非常多的想象空間,將顛覆更多現有的內容模態(tài)。胡雅婷希望自己所創(chuàng)作的產品是一個高于自我的存在,去掉標簽、不被定義,是她想做的事情。

  AI科技評論:你之前得過全國信息學奧林匹克競賽金牌。這段經歷能展開講講嗎?

  胡雅婷:我從高中才開始學競賽,身邊很多人從小學就開始了。最早沒想學,很多人參加競賽可能是因為從小數理化就很好。當時想學是因為我喜歡畫畫,初心是想體驗一下,如果學競賽就可以經常去機房用數字設計的軟件,但沒想到從中找到了算法的樂趣。

  當時看了一本書《算法藝術》,我發(fā)現原來算法也是一個很有創(chuàng)造性的過程,可以用一些巧妙的方法讓一個復雜的問題變得簡單。我當時挺叛逆的,經常會向學校教練反映,應該更改出題思路和學習計劃。

  胡雅婷:主要集中在算法,但這個算法和AI算法會有區(qū)別。它是指經典的算法數據結構,會給出一個具體的問題,但這個問題會有很多種不同的解法。比如運用暴力的方法,逐個去搜索,速度會非常慢,但結果一定是正確的。

  使用不同的方法,能解決算法的范圍也是不同的,所以相應得到的分數也會不同。它不像常規(guī)的高考題,沒有標準的答案,你可能也可以想到出題人從來都沒有想到的方法去解決問題。

  全國信息學奧林匹克競賽,一般從省份比拼到全國大致就100人。最終每位參賽者都會拿到相同的三道題目,通過考察解法,來評定最終能拿到多少分數。

  這個競賽除了決賽,還有省選、冬令營和夏令營等等。在這個過程中,你都可以和高校簽約,就可以不走傳統(tǒng)的高考路徑進入高校,由于湖南和浙江是競賽的強省,所以我在省選就和北京大學計算機系簽約了,2017年進入的北大。

  AI科技評論:在Google、阿里、字節(jié)做算法工程師的實習經歷,對你創(chuàng)業(yè)有影響嗎?

  胡雅婷:我當時覺得計算機行業(yè),還是得多去產業(yè)界看看。一方面,想了解程序員和工程師具體如何參與到產品的流程中;另一方面,想理解互聯(lián)網的實際業(yè)務。這幾段經歷,正好對應了互聯(lián)網的搜索推薦和廣告。

  當時我們在優(yōu)化推薦系統(tǒng)和廣告系統(tǒng),流量基數一般是千億級的,所以優(yōu)化千分之一也會很有成效。但對我來說,它不是一個從0-1搭建的新系統(tǒng),我發(fā)現當時整個互聯(lián)網的流量已經到頂了,只能做一些微小的優(yōu)化,所以我開始有點想創(chuàng)業(yè)。

  胡雅婷:有兩段經歷蠻重要的。學校有一個「人工智能創(chuàng)新中心」,注重 AI 和產業(yè)鏈路的結合。雖然當時還沒有AIGC,但是做AI動畫的項目中,大家就運用判別式AI 的方式直接加入三維引擎的指令,偏生成式的把動畫制作出來。

  另外,在「前沿計算中心」,有一段研究數字經濟學的經歷,當時做的比較好的是算法博弈論。在我離開北大后,其實數字經濟學這一塊,也依然會有很多應用。

  現在,我們定期會和創(chuàng)投相關的北大同學交流,運用偏經濟學的方法解釋我們在創(chuàng)業(yè)中遇到的實際問題。

  胡雅婷:我們一個系有三四百人,很少有人選擇創(chuàng)業(yè),一屆可能就一個。每個人的定位都不太一樣,我們當中大部分同學可能想繼續(xù)做研究,但我確實還是想解決一些真實的問題。

  胡雅婷:學校的創(chuàng)業(yè)氛圍其實不太濃厚,但在2020年的疫情,導致很多留學生回國,突然發(fā)現所有留學生好像都在做一些創(chuàng)業(yè)嘗試。

  大家一起展開了挺多創(chuàng)業(yè)相關的活動,相當于真正開始了解創(chuàng)業(yè)。我就開始接觸到一些投資人等等,他們對于年輕人創(chuàng)業(yè)是比較支持的。

  胡雅婷:當時說元宇宙,我們自己的定義是3D互聯(lián)網,整個 3D 內容的全流程都做,包括3D數字人、角色動畫以及偏AR的數字資產的玩法等。

  現在做Aiuni AI產品,是從3D模型、動畫甚至特效,也就是CGI和VFX的流程可以用 AIGC全部自動化,并且重塑工作流。2023年年底,一系列實驗結果發(fā)現,AI生成3D是可以做到商用級的,所以就開始重點做Aiuni AI產品。

  AI科技評論:之前看到一個統(tǒng)計,在國內做3D領域的很少,為什么海外在這個領域就很多?

  胡雅婷:我感覺3D領域華人可能做得更多,但大家都是做全球化的市場。3D領域的競爭格局還沒有形成,就比如Midjourney和OpenAI已經跑出來了,你不可能再定義去做海外。但3D領域其實美國公司也還沒有跑出來,所以中國公司定位會是全球。

  胡雅婷:我自己還是很相信內容升維這件事,平面上的內容,無論是圖片還是視頻,能做的都已經被人做了。但我覺得3D是一個全新的內容模態(tài),可以隨時提出新的算法和架構,有很多全新的問題待解決,可以做的空間還很大。

  我確實非常喜歡整個CG的內容,包括整個三維的發(fā)展,它確實是一個可以和藝術相結合的領域。

  胡雅婷:公司CTO因為全國信息學奧林匹克競賽而認識,他在清華姚班,目前在公司主要做AI+3D算法相關的工作;COO是北大的學姐,她是北大藝術史論與工商管理雙學位,目前負責運營和創(chuàng)作者相關的工作;還有兩位成員,一位是算法研究員,一位是CG Artist。

  AI科技評論:Aiuni AI產品的定位以及一開始直接開源模型Unique3D,是基于什么考慮?

  胡雅婷:Aiuni AI產品主要就是用AI生成三維動畫,目前已經上線D模型生成以及全景生成,接下來會做3D 生成空間模型、動畫生成、角色生成、渲染合成等。

  我們認為3D還是一個開源開放的技術,讓更多的人參與其中,用技術換取一些影響力。同時,產品商業(yè)化方面,我們不準備以單一的API方式去做商業(yè)化,想做全流程的事情,比如角色動畫或者合成一個直接能拿去商用的視頻,我們更關注這些。

  胡雅婷:我們運用了比較創(chuàng)新的生產架構,相當于對3D Mesh進行了像素級的優(yōu)化,所以你的圖片有多精致,相應生成的模型精度就會有多高。在多視角渲染圖方面,我們實現了超分辨率。

  其他算法如果走三維輻射場的話,一般的分辨率最高就是256或者512,如果達到512的分辨率就會消耗很多顯存。但我們有一個直接優(yōu)化Mesh的算法,它的復雜度不與模型體積相關,而是與表面積相關。我們現在的版本優(yōu)化到了2K級,如果后續(xù)我們想要優(yōu)化到8K級,三維生成也是可以在幾分鐘內就可以實現。

  胡雅婷:目前的功能是三維生成和全景生成,接下來重點上線的功能主要是角色生成和角色動畫的生成?,F在3D模型有百萬級的生成量,大家反復生成的數據還是比較高的,反復使用的用戶有70%,海外用戶也有60%。

  胡雅婷:主要還是數字內容的創(chuàng)作者。他們分兩類,一類是專業(yè)化的用戶,主要是3D的設計師和動畫師等;一類是IP創(chuàng)作者,用AI工具創(chuàng)作喜歡的形象,再進一步生成模型和動畫。

  這兩類人群各占一半,接下來我們聚焦在動畫方面,就會更關注偏創(chuàng)作者的這些群體。

  胡雅婷:我們的產品相當于數字內容的生產力,作為內容創(chuàng)作者,他們希望產出很好的新媒體內容,分享發(fā)布形成自己的IP。做新媒體,動畫視頻肯定比做圖文會好,但是之前的3D模型和動畫的制作非常繁瑣。

  一般做 3D 模型建模就需要一周,如果需要綁定動畫渲染,基本上就得一個月,找人去做是一個非常高的成本。但現在運用AI工具,30秒就可以生成模型,創(chuàng)作者改一改,一個小時就可以制作動畫,這完全是一個新的生產方式。

  我們和這些創(chuàng)作者交流的時候,大家會覺得創(chuàng)作是不分模態(tài)的,比如他們只想做一個好的IP角色,他們之前只能做圖文,如果大家都想做更加立體和動態(tài)的內容來生成動畫,他們一定會去生成動畫。

  胡雅婷:我們覺得平臺的核心壁壘,它不會完全是某一個技術或者功能點,核心是要形成這些創(chuàng)作者的生態(tài),生出來的內容確實是能形成內容矩陣,具備IP影響力。

  我們大部分的用戶在制作了動畫后都會發(fā)布到新媒體,我們通過建立社群來第一時間聽到用戶的反饋,最近我們也在做一些創(chuàng)作者共創(chuàng)的計劃。

  AI科技評論:從3D到4D,這中間經歷多長時間的訓練?要克服的技術難點是什么?之前生成時間30s,4D生成速度要多久?

  胡雅婷:時間還好,關鍵是涉及比較多的模態(tài),我們不是一整個端到端的模型,會有數十個垂類模型,每個模型負責處理并解決一類問題,然后串起整個流程。

  即將發(fā)布4D,但這個4D會是狹義的,我們會讓一個模型先能動起來。但是所說的全面4D,它可以實現整個空間的交互,也就是直接可以從腳本生成影視級的動畫,需要涉及更多的模態(tài),包括角色交互、場景交互、物理模擬等等。我覺得要把整個CGI 的流程 AI化,最起碼還得3-5年的時間。

  生成簡單的4D不會比生成3D的時間用得久,因為一個復雜模型的骨骼點也就幾十個點,只需要每一幀去生成這幾十個關節(jié)點的向量,所以它的生成效率很高,可以做到實時生成。

  AI科技評論:實現4D技術路線你們是直接做視頻模型,把視頻模型變成4D還是用圖生成 3D,再把 3D變成4D?

  胡雅婷:其實是用圖生成 3D,再把 3D變成4D的技術路線D之后你就可以渲染成一個視頻,你可以設置你的虛擬場景,在生成器里可以合成實拍的視頻。

  胡雅婷:首先,我們的定位不是一家AI 3D 的公司,我們做的事情是以3D原生去生成動畫數據,然后渲染合成一個視頻。AI 3D的創(chuàng)作門檻還是比較高,線D文件的人還是比較少,所以我們更希望它能輸出動畫視頻,相比目前市場上的AI視頻,我們會有更好的角色一致性和場景連續(xù)性,利于創(chuàng)作者創(chuàng)作長期的內容。

  其次,我們的產品有更好的可控制性,創(chuàng)作者可以直接控制想要的角色,放進某一個場景,需要連接到某一個動作。最后,可編輯性也是我們的優(yōu)勢,相當于原生有矢量化以及分層的表示,創(chuàng)作者可以更好去編輯。

  AI科技評論:AI生成動畫里角色動作幅度越大,就代表技術難點可能更多嗎?

  胡雅婷:具體要看運用什么樣的技術方案,現在有一類AI動畫仍然使用AI視頻的技術方法,一幀一幀生成每個像素。但我們所說的3D動畫走偏骨骼動畫的方法,它生成的是骨骼點,所以骨骼是可以有很大的幅度。所以技術路線會導致訓練和效果的不同。

  胡雅婷:首先,開源模型Unique3D,我們覺得它的精度和還原度是現在3D方案里最高的。 通過很多創(chuàng)作者的反饋,他們對于生成動畫的精度和還原度都有很高的需求,他們不希望自己的設計被改變。

  AI科技評論:你們和多家動畫、影視、品牌、IP行業(yè)的上市公司及大廠有戰(zhàn)略合作,能展開講2個具體合作嗎?

  胡雅婷:和Nano Labs 合作了3D生成的系統(tǒng),他們更想在AR拍攝以及3D打印的領域有一些應用。還有國內目前最大的動畫上市公司奧飛娛樂,和他們旗下很知名的IP合作了AR拍照以及衍生品。

  也和互聯(lián)網的大廠有合作,像支付寶采購過數字星球的生成器;小紅書和字節(jié)當時做了很多AR的虛擬服飾;還有一些影視公司,合作了一些偏特效的視頻。

  胡雅婷:我們做過B端的商業(yè)化,接下來主要面向C端。C端這邊只要將模式跑通,它的增量更規(guī)?;N覀冎饕胱鲇嗛喼?,以專業(yè)度和生成量去做一個階梯的區(qū)分。

  IP授權也是比較好的商業(yè)模式,就是指作為一個用戶,創(chuàng)作了某一些角色或者特效的模板,其他的用戶或者B端也可以來授權使用,形成創(chuàng)作者經濟。

  AI科技評論:相比成熟的連續(xù)創(chuàng)業(yè)者,你覺得作為00后創(chuàng)業(yè)者,和他們相比,最大的優(yōu)勢是什么?

  胡雅婷:首先,不能和成熟的創(chuàng)業(yè)者競爭偏傳統(tǒng)或較成熟的AI領域,你肯定卷不過他們。年輕人還是要做新模態(tài)的東西,得做下一個模態(tài)的技術,挖掘新生代用戶的需求和場景,你得找到這種優(yōu)勢。

  其次,整個3D和4D的算法每天可能都會有新技術出現,即使你在互聯(lián)網大廠有再多的AI經歷,大家面對它們也都是全新的起點。還有應用場景,無論是新媒體博主、原創(chuàng)角色還是二創(chuàng)場景,主要活躍用戶也都是00后為主。

  最后,團隊協(xié)作我們更去中心化,工作不需要打卡,有些同事可能中午才來工作,但他會工作到凌晨。我們不會有硬性的要求,推著大家去工作,而是給大家更多的自由。

  AI科技評論:很多人稱你為北大00后學霸、天才,如果讓你重新定義自己,你喜歡怎么稱呼自己?

  胡雅婷:在青春期,可能會用標簽給自己定義,但創(chuàng)業(yè)對我來說就是去掉標簽的過程。我就是希望我創(chuàng)造的這些東西可以不被定義。我希望自己創(chuàng)作的產品會是一個高于自我的存在,我就是不想要被定義才會去做這些事情。

  胡雅婷:我很喜歡皮克斯,很關注他們整個創(chuàng)業(yè)的過程以及創(chuàng)造的方法。一開始關注是因為三維,最早提出三維Mesh的發(fā)明人就是皮克斯的創(chuàng)始人。

  他們確實是把新的技術和藝術形態(tài)做了很好的結合,回顧他們的整個創(chuàng)業(yè)經歷,他們不會過度的強調技術,更關注到底什么是好的內容?用戶對于好的內容的真實需求是什么樣的?怎么去講一個好的故事?

  胡雅婷:我們得實現從三維產品到應用的閉環(huán)?,F在各家3D生成,圖片生成3D到3D文件,我覺得它就是一個很薄的工具。

  但是如果可以實現生成動畫,用戶可以導出文件直接發(fā)布成一個新媒體視頻,并且這個新媒體視頻又可以成為創(chuàng)作者經濟的來源,這就是一個很好的閉環(huán)。相當于用技術創(chuàng)造了用戶的價值,并且它可以實現更好地增長和規(guī)模化。

  胡雅婷:偏 IP 以及藝術類的賽道,品牌相應會強一點。它很關鍵的點,首先你得第一個做,要有搶先優(yōu)勢,它和技術搶先優(yōu)勢不一樣,類似迪士尼是第一個做有聲動畫的,大家會比較認這件事情。

  當然我們需要通過品牌效應,更好地構建創(chuàng)作者的生態(tài),他們會帶來網絡效應,這不是一個純技術或者產品上的復制就可以被人替代的。

  胡雅婷:未來會有很大的想象空間,我們在做的 3D 動畫,它和傳統(tǒng)的視頻最不同的就是它本身是一個空間視頻。所以它兼容到下一代的MR設備,就完全會是一個新的互動模態(tài),類似Vision Pro。

  在未來的這種空間視頻里,你可以直接和角色互動,你會覺得角色在你面前和你打招呼。這個和之前的內容模態(tài)會完全不同,所以我覺得在這個時代你是有機會構建一個新的內容平臺,去連接新一代的創(chuàng)作者和消費內容的場景。

  AI科技評論:很多人會覺得 AI 應用其實目前已經到了一個增長的瓶頸,從你個人來看,你覺得 AI應用有未來嗎?

  胡雅婷:我覺得 AI 應用還得是模型的模態(tài)和應用場景相匹配,如果是一個套殼肯定是不太行的。

  比如,做4D相當于是新的數據結構,你要找到合適的應用場景并訓練匹配的模型算法,它是可以不斷增長,有一個比較好的循環(huán)。但我覺得這種產品它不可能在今年突然爆發(fā),在原有數據和用戶數據中需要一定持續(xù)的積累。


本文由:捕魚大作戰(zhàn)機械公司提供