大模型
LLM,VLM,模型
智谱AI给中国大模型公司的商业化打了样
智谱AI,一家由清华大学知识工程实验室孵化的人工智能公司,已经在人工智能领域取得了显著的成果。在2023年,该公司累计获得超过25亿元的融资,成为国内估值...
苹果大模型MM1杀入场:300亿参数、多模态、MoE架构,超半数作者是华人
苹果公司近期在生成式人工智能(GenAI)领域取得了显著进展,特别是在多模态大型语言模型(MLLM)的研究上。苹果CEO蒂姆·库克在2024年苹果股东大会上表示,公...
美团龙珠,投了最火90后
模型信息 【模型公司】 月之暗面 【模型名称】 moonshot-v1-32k 【摘要评分】 ★★★★★ 文章摘要 【关 键 词】 月之暗面、A轮融资、美团龙珠、...
透过科大讯飞的“AI+”行业实地战,看中国新质生产力变革的未来之路
人工智能+(AI+)在2024年两会中首次被写入政府工作报告,标志着国家将加强顶层设计,加速形成以AI为引擎的新质生产力。全国人大代表、科大讯飞的董事长刘庆...
深入理解Sora技术原理|得物技术
视频生成时,获取随机噪声视频,通过训练的视频压缩网络,将噪声视频压缩成低维度的潜在空间数据,以便更好的处理视频数据。将压缩后的潜在空间数据分解成空...
独家支持MoE大模型一键训练,达观大模型管理平台两大全新功能发布
达观大模型管理平台推出曹植MoE模型达观大模型管理平台(DATAGRAND)推出了支持中文的曹植MoE模型,以满足用户多样化的模型管理需求。曹植MoE模型具有更大的...
首个AI程序员:能接单干私活,自动微调大模型!
文章介绍了专注于AIGC领域的专业社区,关注微软 & OpenAI、百度文心一言、讯飞星火等大语言模型(LLM)的发展和应用落地的主题。其中,AI初创公司Cognition发...
LLaMA-2-7B数学能力上限已达97.7%?Xwin-Math利用合成数据解锁潜力
这篇文章介绍了一项由西安交通大学、中国科学技术大学、清华大学和微软亚洲研究院的学者共同完成的研究工作,名为Xwin,旨在探索通用预训练下规模为7B的语言...
4万亿个晶体管,单机可训练比GPT4大10倍的模型,最快最大的芯片面世
Cerebras宣布推出了历史上最重要的消息,发布了拥有高达4万亿个晶体管的WSE-3芯片,是世界上最快的芯片之一。该公司一直致力于开发大型芯片,之前发布的WSE-1...
智能体的ChatGPT时刻!DeepMind通用AI向人类玩家进化,开始理解游戏
这篇文章报道了谷歌 DeepMind 最新的研究成果:他们开发了一种名为SIMA(Scalable Instructable Multiworld Agent)的通用AI智能体,适用于3D虚拟环境。SIMA...




