大模子混战升级,腾讯混元上线文生视频智商并晓示开源
大模子在文生视频赛说念的混战再度升级。12月3日,腾讯混元大模子崇敬上线并开源文生视频智商,守旧中英文双语输入,一句话就能生成视频。据先容,这次开源的视频生成大模子,参数目130亿,是现时最大的视频开源模子。

把柄演示视频,记者看到,该大模子生成的视频写实度颇高,生成的画面收敛易变形。在镜面或镜子场景中,不错作念到镜面反射动作和外面同步,光影反射基本合乎物理规章。
值得提防的是,这次大模子的文生视频智商开源。腾讯示意,本次开源包含模子权重、推理代码、模子算法等完好模子,可供企业与个东说念主设置者免费使用和设置生态插件。庸俗用户可在腾讯元宝APP-AI愚弄-AI视频中提交肯求试用,企业客户可通过腾讯云提供管事接入,API同步敞开内测肯求。
从年头以来,腾讯混元系列模子的开源速率连接加速。此前,该系列大模子依然开源了旗下文生文、文生图和3D生成大模子。至此,该系列大模子已已毕全面开源。
近段时刻以来,视频生成大模子赛场未艾方兴。生数科技打造的视频大模子Vidu上线,面向用户敞开文生视频和图生视频两大功能;智谱AI崇敬发布视频生成大模子“清影”;商汤发布东说念主物视频生成大模子Vimi;阿里达摩院推出一站式AI视频创作平台“寻光”;快手可灵AI崇敬上线网页端,并开源可控东说念主像视频生成框架……
“视频的实质不错手脚是多张图片的流通排布放映,在文生图大模子中,最被东说念主们熟知的本事是扩散模子,它不错把柄输入的笔墨描绘,取得数据的内在结构和散布规章,从而生成单张图片。”别称业内东说念主士诠释称,在算力有限的情况下,决定视频质地的关节取决于数据的质地和数目,“现在,在视频生成大模子的比拼中,对物理寰宇规章的判辨、高分歧率、镜头动作连贯性以实时长等,王人是行业激战且有待擢升的进攻维度。”
记者:袁璐