日前有消息源透露,国内人工智能(AI)初创企业智谱AI或正在研发对标OpenAI Sora的高质量文生视频模型,并预计最快年内发布。同时这一消息源还表示,“今年2月Sora发布之前,智谱AI已经在研发文生视频模型”。
有相关报道援引智谱AI内部人士透露的消息称,“文生视频目前处于一个快速发展的阶段,预计今年将是文生视频大模型的爆发期。国内公司在文生视频技术方面的客户需求非常多样,从电影拍摄到短视频、游戏制作等。智谱也将通过使用更高质量的数据和更大的参数,开发高质量的文生视频产品”。
这位内部人士还指出,对标Sora的文生视频模型发展突破的关键主要包括技术路线选择、训练所用的高质量视频素材语料两个方面。对此他表示,“技术路线上,Transformer与Diffusion的结合架构如何在效率和效果上进行优化,如何解决连续帧之间的抖动问题,如何在满足高分辨率的同时实现高一致性的长序列生成,如何获取高质量数据泛化到更多更细节的真实场景,都是技术上需要解决和通过大量实验试错的问题。数据集方面,此前Sora被评价模型对摄影术语(跟拍、平移、镜头切换)的理解有限,所生成的视频后期还需要对视频素材进行超分处理。公司会注重更全面的优质数据版权与使用”。
公开资料显示,智谱AI成立于2019年6月,是由清华大学计算机系知识工程实验室的技术成果转化而来,团队核心成员曾参与清华大学与智源研究院合作项目“悟道”的研发工作,包括CEO张鹏、技术顾问唐杰等。
自成立以来,智谱AI已获得多轮投资。仅在2023年,该公司便累计获得超25亿元融资,投资方主要包括社保基金中关村自主创新基金(君联资本为基金管理人)、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构。今年3月智谱AI已完成新一轮融资,投资方包括北京市人工智能产业投资基金等。
据了解,智谱AI专注于做大模型的自研创新,早在2020年便已开始GLM预训练架构的研发,并训练了百亿参数模型GLM-10B。随后在2021年,该公司利用MoE架构成功训练出万亿稀疏模型,并于次年合作研发了双语千亿级超大规模预训练模型GLM-130B,以及基于此千亿基座模型开始打造大模型平台及产品矩阵。
2023年3月,就在GPT-4发布的同一天,智谱AI方面推出千亿基座的对话模型ChatGLM系列,并在过去一年内完成4次升级,随后在年底推出GLM4系列。基于全自研基座大模型的能力,智谱AI还构建了AIGC模型产品矩阵,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。
值得一提的是,此前在今年3月智谱AI CEO张鹏曾透露,2023年公司就已拥有超过2000家生态合作伙伴、超1000个大模型规模化应用,并有200多家企业与智谱AI进行了深度共创,覆盖传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景的多个头部企业。张鹏曾对此表示,“切切实实的、潜移默化的在改变着每一个客户的业务、效率,甚至更深度的改变着客户的业务范式和组织架构,这是我们所希望看到的”。
需要注意的是,在智谱AI或正研发类Sora文生视频模型的消息传出不久前,该公司参与投资的生数科技方面与清华大学联合推出中国首个原创全自研长时长、高一致性、高动态性的视频大模型Vidu。据悉,Vidu支持一键生成长达16秒、1080p分辨率的高清视频内容,具备模拟真实物理世界、富有想象力、多镜头语言、高时空一致性、理解中国元素等特色。
对此有观点认为,“一旦发布类似的文生视频模型的话,智谱AI或将与生数科技产生竞争关系”。
【以上内容转自“三易生活网”,不代表本网站观点。如需转载请取得三易生活网许可,如有侵权请联系删除。】
延伸阅读:
- 西安未来人工智能计算中心亮相2023年认知与智能计算高峰论坛
- 竹间智能、中科曙光和智谱AI达成战略合作,“加速”通用人工智能在企业落地的到来!
未经允许不得转载:头条今日_全国热点资讯网(头条才是今日你关心的) » 智谱AI正研发类Sora文生视频模型,最快年内发布