钛媒体AGI独家|智谱AI正研发对标Sora的国产文生视频模型,预计最快年内发布

钛媒体AGI独家|智谱AI正研发对标Sora的国产文生视频模型,预计最快年内发布

 

文章摘要


【关 键 词】 AI独角兽智谱AI大模型ChatGLM系列国产化

智谱AI是国内AI领域的独角兽企业,估值超过200亿元人民币。公司正在研发一款对标美国Sora的高质量文生视频模型,预计最快年内发布。智谱AI成立于2019年,由清华大学计算机系的技术成果转化而来,创始团队均为清华大学知识工程(KEG)实验室的核心成员。

智谱AI是国内最早入局大模型赛道的公司之一,也是目前国内头部大模型厂商代表之一。2023年3月,智谱AI推出千亿开源基座对话模型ChatGLM系列,并在过去一年内完成4次升级,于2024年1月推出GLM4系列。基于全自研基座大模型的能力,智谱AI已构建了AIGC模型产品矩阵,包括AI提效助手智谱清言、高效率代码模型CodeGeeX、多模态理解模型CogVLM和文生图模型CogView等。

截至2023年底,智谱AI已拥有超2000家生态合作伙伴、超1000个大模型规模化应用,另有200多家企业跟智谱AI进行了深度共创,覆盖传媒、咨询、消费、金融、新能源、互联网、智能办公等多个细分场景的多个头部企业。智谱ChatGLM-6B全球累计下载量已经超过了1300万,GitHub Star星数达到5万,整个量级超过了Meta Llama两个版本的总和。智谱AI已获得全球最受欢迎的开源机构的第五名,是全球唯一一家上榜的中国机构和组织。

融资方面,智谱AI已完成五轮融资,投资方包括君联资本、启明创投、中科创星、美团、蚂蚁、阿里、腾讯、小米、金山、顺为、Boss直聘、好未来、红杉、高瓴等多家机构,2023年融资额超过25亿元人民币,最新一轮是2024年3月北京市人工智能产业投资基金参与投资。

智谱AI的综合能力水平接近海外顶级模型。最新基座大模型GLM-4,整体性能相比上一代大幅提升,逼近GPT-4。在中文对齐的任务下,智谱AI甚至可以略微超过GPT-4。根据最新的海外伯克利Arena Hard基准测试,GLM排名仅次于GPT-4 Turbo和Claude 3 Opus,在国内外模型中均处于领先地位。

智谱AI拥有完全自主、自研、国产化的千亿级模型算法,并实现了全栈国产化,从底层到模型层、应用层、应用接口PaaS层等实现全栈的自主研发。在整个大模型体系中,除了语言模型,还有文生图模型、图生文模型、代码模型等多种模型。与目前全球最先进的OpenAI相比,其模型种类跟它形成了一一对标。

智谱AI正在研发的文生视频模型发展突破的关键包括技术路线选择、训练所用的高质量视频素材语料两个方面。技术路线上,Transformer与Diffusion的结合架构如何在效率和效果上进行优化,如何解决连续帧之间的抖动问题,如何在满足高分辨率的同时实现高一致性的长序列生成,如何获取高质量数据泛化到更多更细节的真实场景,都是技术上需要解决和通过大量实验试错的问题。数据集方面,公司会注重更全面的优质数据版权与使用。

值得注意的是,智谱AI投资的生数科技与清华大学联合发布中国首个长时长、高一致性、高动态性视频大模型Vidu,被称为“国内首个Sora级视频模型”,也是中国首个纯自研视频大模型。一旦智谱也发布类似的文生视频模型的话,智谱AI或将与被投公司生数科技产生竞争关系。

据钛媒体AGI编辑梳理,截止目前,智谱AI以产业型投资方式,已经投资、入股超过13家AI产业链初创公司。智谱AI正在经历一个从量变到质变的过程,特别是像大模型所谓的涌现。公司目标是瞄准AGI,实现超过人类水平的超级认知智能、实现AI的自我解释、自我评测、自我监督,同时还将确保模型安全、可控。

原文和模型


【原文链接】 阅读原文 [ 1590字 | 7分钟 ]
【原文作者】 钛媒体AGI
【摘要模型】 moonshot-v1-32k
【摘要评分】 ★★★☆☆

© 版权声明
讯飞星火大模型

相关文章

星火内容运营大师

暂无评论

暂无评论...