9月25日,生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝在百度云智大會(huì)上宣布,生數(shù)科技旗下視頻大模型Vidu正式開放API(應(yīng)用程序編程接口),并同步接入百度智能云千帆大模型平臺(tái),成為平臺(tái)接入的首個(gè)視頻大模型。
生數(shù)科技作為國(guó)內(nèi)最早布局多模態(tài)通用大模型的團(tuán)隊(duì)之一,今年4月聯(lián)合清華大學(xué)發(fā)布了視頻大模型Vidu。
6月,生數(shù)科技完成數(shù)億元Pre-A輪融資,由百度、北京市人工智能產(chǎn)業(yè)投資基金領(lǐng)投,中關(guān)村(000931)科學(xué)城公司、啟明創(chuàng)投等跟投。彼時(shí),生數(shù)科技方面曾表示,將基于百度百舸·AI異構(gòu)算力平臺(tái)持續(xù)訓(xùn)練、提升模型能力,并逐步通過(guò)百度智能云千帆平臺(tái)開放模型服務(wù)。
據(jù)唐家渝介紹,Vidu采用的架構(gòu)是團(tuán)隊(duì)純自研的U-ViT架構(gòu),是全球最早提出的Diffusion Transformer融合架構(gòu),早于Sora的DiT架構(gòu),這為通用生成任務(wù)奠定了重要基礎(chǔ)。
生數(shù)科技聯(lián)合創(chuàng)始人兼CEO唐家渝 圖片來(lái)源:企業(yè)供圖
他同時(shí)表示,Vidu模型具備文生視頻和圖生視頻能力,同時(shí)支持中英文指令輸入;在時(shí)長(zhǎng)方面,Vidu在模型層面最長(zhǎng)可支持一鍵32s視頻的生成;畫面質(zhì)感方面,Vidu最高可輸出1080p分辨率。
生數(shù)科技方面表示,目前,影視、動(dòng)畫、廣告等行業(yè)的企業(yè)機(jī)構(gòu)普遍存在規(guī)模化視頻產(chǎn)出需求,Vidu API的開放,將助力這些企業(yè)在視頻生產(chǎn)環(huán)節(jié)降本增效,并激發(fā)創(chuàng)意。同時(shí)對(duì)于眾多開發(fā)者而言,Vidu API的開放也為探索AI 2.0應(yīng)用提供了重要基礎(chǔ)。
生數(shù)科技認(rèn)為,視頻大模型高度個(gè)性化、自動(dòng)化的內(nèi)容創(chuàng)作能力,將賦予企業(yè)在營(yíng)銷、品牌推廣和內(nèi)容創(chuàng)新等場(chǎng)景中的全新競(jìng)爭(zhēng)力,視頻模型的引入將成為創(chuàng)意產(chǎn)業(yè)提升競(jìng)爭(zhēng)力的關(guān)鍵因素;诖吮尘,開放Vidu API成為生數(shù)科技進(jìn)一步推進(jìn)商業(yè)化布局的重要戰(zhàn)略舉措。
2024年以來(lái),視頻大模型的競(jìng)爭(zhēng)日趨激烈,9月24日,字節(jié)跳動(dòng)剛剛宣布發(fā)布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed兩款大模型。在此之前,行業(yè)內(nèi)已有快手的視頻生成大模型“可靈”;同時(shí),阿里旗下的通義萬(wàn)相在9月宣布全面升級(jí),并發(fā)布全新視頻生成模型;圖像賽道的老玩家美圖秀秀同樣在9月宣布旗下的美圖奇想大模型(MiracleVision)視頻生成能力全面升級(jí)。
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與和訊網(wǎng)無(wú)關(guān)。和訊網(wǎng)站對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。郵箱:news_center@staff.hexun.com
最新評(píng)論