近日(ri),美國開放人工智能研(yan)究中心(OpenAI)推出的視(shi)頻生成模型Sora震驚(jing)了IT圈(quan)。
Sora目前展示(shi)出(chu)的(de)功能十分(fen)強大(da),能夠根(gen)據用戶(hu)輸入的(de)關(guan)鍵詞生成長(chang)達“60S”的(de)視頻且視頻質量非(fei)常高(gao)。
1、Sora生成的視頻具有多樣化表現
(1)在原始視(shi)頻(pin)(pin)圖像數據直接(jie)(jie)訓練:過去(qu),圖像和視(shi)頻(pin)(pin)生(sheng)成需要(yao)將(jiang)視(shi)頻(pin)(pin)調整標準(zhun)要(yao)求,但Sora打(da)破了這一(yi)常規,可以直接(jie)(jie)在原始數據上進(jin)行訓練。
(2)采(cai)樣更(geng)靈(ling)活(huo):Sora具備更(geng)靈(ling)活(huo)的采(cai)樣能(neng)力(li),無論是寬屏1920x1080p視頻(pin)(pin)、垂(chui)直1080x1920視頻(pin)(pin),還是介于兩者之間的任何尺(chi)寸(cun)視頻(pin)(pin),都能(neng)輕松應(ying)對,這意味著Sora可(ke)以為各種視頻(pin)(pin)生成要(yao)求匹配更(geng)恰當的內(nei)容。
(3)改進構圖(tu)與框架:將Sora與一個(ge)將所有訓練視(shi)頻裁剪(jian)為方形的(de)模型(xing)版本(ben)進行了比較(jiao)。結(jie)果發(fa)現,在(zai)正方形裁剪(jian)上訓練的(de)模型(xing)有時會生(sheng)(sheng)成僅部(bu)分顯(xian)示主題的(de)視(shi)頻。而(er)Sora則能呈現出(chu)更加貼合(he)的(de)幀,充分展現了其在(zai)視(shi)頻生(sheng)(sheng)成領域的(de)優異性能。
(4)Sora具有圖像和(he)視頻(pin)的多樣(yang)(yang)化(hua)提示,可以接受圖像或視頻(pin)等(deng)多樣(yang)(yang)形式的輸(shu)入(ru)。
2、Sora深(shen)化語言理(li)解
研究(jiu)員利用GPT技術將(jiang)簡短的(de)用戶提示轉換為更長的(de)詳(xiang)細轉譯, 并(bing)將(jiang)其(qi)發送至模(mo)型(xing),這一應用使得Sora能夠精準(zhun)地(di)按(an)照(zhao)關鍵(jian)詞生成高(gao)質量(liang)的(de)視頻(pin)。
3、Sora具有(you)新(xin)的模擬(ni)能力
在大規模(mo)訓練(lian)過程(cheng)中,研究員(yuan)發(fa)現(xian)Sora能夠模(mo)擬現(xian)實世界中的(de)人(ren)物、動(dong)物和(he)環境等(deng)方面(mian),并且這些(xie)并沒有依賴于任何明確的(de)3D建模(mo)、物體識別等(deng)歸(gui)納偏差(cha),而是(shi)純粹通過模(mo)型的(de)尺度擴展而自然展示的(de)。
Sora的出現,預示著一個全新的視覺敘事時代的到來,能夠依據關鍵詞,將人們的想象力轉化為動態畫面,而這種生成技術一旦得到場景化應用,將對各行各業帶來顛覆式的發展。
但Sora的行業發展之路無論從自身所需資源還是社會接受度都還需要(yao)度過(guo)一段艱難(nan)的時間。數據、算法和算力作為人工智能三素,也整體制(zhi)約人工智能技術的發展。
算力(li)(li)作為人(ren)工智能技術發(fa)展的底(di)層源動力(li)(li),對大模型的訓練和(he)推理至關重要,而(er)服務(wu)器(qi)則是算力(li)(li)的底(di)層載體(ti)。
針(zhen)對大模(mo)型(xing)訓(xun)練(lian),安擎基于“訓(xun)練(lian)服(fu)(fu)務(wu)器+推理(li)服(fu)(fu)務(wu)器+存儲服(fu)(fu)務(wu)器”,推出“大模(mo)型(xing)算存解決方案”。
·EG8628G4·
安擎(qing)EG8628G4是(shi)一款面向(xiang)云(yun)計(ji)算(suan)、大數據、AI等應用場景的(de)高(gao)(gao)性(xing)能服(fu)務器,支持第四代英(ying)特爾?可擴展處理器。采(cai)用NVIDIA NVlink 互聯技術,在6U空(kong)間內支持最(zui)新計(ji)算(suan)模塊,單機AI性(xing)能達(da)到16 PFlops,具(ju)有(you)高(gao)(gao)擴展和高(gao)(gao)可用性(xing)。
·EG540S-G30·
安(an)擎EG540S-G30是一款4U雙路(lu)存儲產品,支持(chi)Icelake全系(xi)列擴展(zhan)處理器,整機(ji)可(ke)(ke)支持52個硬盤存儲槽(cao)位,單機(ji)可(ke)(ke)提供1PB的存儲空間。
安擎作為專業的AI服(fu)(fu)(fu)務(wu)器(qi)(qi)提供商,深(shen)耕AI服(fu)(fu)(fu)務(wu)器(qi)(qi)研產(chan)銷多年(nian),具有五大(da)系(xi)列產(chan)品(訓練(lian)服(fu)(fu)(fu)務(wu)器(qi)(qi)、推(tui)理服(fu)(fu)(fu)務(wu)器(qi)(qi)、邊緣(yuan)服(fu)(fu)(fu)務(wu)器(qi)(qi)、存(cun)儲服(fu)(fu)(fu)務(wu)器(qi)(qi)、通(tong)用服(fu)(fu)(fu)務(wu)器(qi)(qi)),并(bing)擁有完備的供應(ying)鏈體系(xi)。
返回列表