股票配资传奇 智谱AI发布文生视频模型,面向所有用户开放

发布日期:2024-09-10 08:29    点击次数:62

   AI视频创作赛道的竞争愈演愈烈。

  7月26日,大模型创业公司智谱AI对外发布了一款全新的文本生成视频(文生视频)工具清影智谱(Ying),用户只需输入一段几个字到几百个字不等的文字描述(俗称Prompt),就可以生成卡通3D、黑白、油画、电影等不同风格的视频片段,并可配上自带的音乐,30秒的时间可生成6秒视频。

  除了文生视频的功能以外,清影(Ying)还具备图片生成视频(图生视频)的能力,其应用场景包括表情包制作、广告制作、剧情创作、短视频创作等。智谱AI方面称,即日起,所有用户均可通过智谱清言App免费体验AI文本生成视频和图像生成视频的服务,无需预约,免费用户也可以不限次数使用。

  “商用方面,清影(Ying)API也同步上线大模型开放平台bigmodel.cn,企业和开发者通过调用API的方式,体验和使用文生视频以及图生视频的模型能力。”智谱CEO张鹏对外表示,“清影(Ying)底座的视频生成模型是CogVideoX,它能将文本、时间、空间三个维度融合起来,参考了Sora的算法设计,它也是一个DiT架构,通过优化,CogVideoX相比前代(CogVideo)推理速度提升了6倍。”

  今年2月,OpenAI推出文本生成视频模型Sora,可以根据用户提示词生成长达1分钟的视频,效果足以乱真,极大地拓展了AI在视频内容生成方面能力。相比此前已有的视频生成模型,Sora在时长和分辨率上大幅超越,强大的文本理解和细节生成能力更是引发全球关注,被视为AI领域的新里程(002219)碑。

  此后,国内外视频生成模型迎来了新一轮技术大爆发,谷歌、字节跳动、生数科技、Luma AI、快手等国外内公司陆续公布了文生视频模型相关产品或进展。4月27日,AI企业生数科技发布首个文生视频模型Vidu,官方称,该模型全面对标Sora,能够生成最长为16秒的视频,分辨率1080P。6月6日,快手自研视频生成大模型“可灵”官网上线,并发布20余款根据文字提示生成的示例视频,该模型支持生成长达2分钟、帧率30fps的视频,分辨率可高达1080p,并支持自由的宽高比。

  面对这股技术浪潮,不少传统行业的从业者感到颠覆与重塑正在上演,有观点称股票配资传奇,这势必对影视行业造成直接冲击。7月26日,张鹏在回应媒体采访时表示,现有的AI视频生成技术无法彻底替代影视行业,更多是辅助的作用,但AI对于影视行业的变化是有积极意义的。目前来讲,把AI直接用在面向观众的影视生产过程当中可能还是不太够,最多是做小规模的创作。他表示,“如果AI真正要达到改变电影的制作等更高要求的任务,可能还得要有一段路去走。”