大模型
LLM,VLM,模型
3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D
DreamTech在2024年5月官宣了其开发的高质量3D生成大模型Direct3D,该模型采用原生3D-DiT技术,克服了3D内容生成领域的多项挑战。Direct3D通过3D VAE压缩3D数...
LLM最全「怪癖」首曝光!马里兰OpenAI等30+学者祭出75页提示报告
由马里兰大学、OpenAI、斯坦福大学、微软等12所机构的30多名研究者共同完成的一项大规模系统研究,首次深入探讨了大型语言模型(LLM)的提示技术,并发布了一...
“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?
纽交所因技术问题导致巴菲特的伯克希尔-哈撒韦公司股价暴跌近100%,事后分析指向更新软件时的数据一致性问题和数据库问题。金证科技采用组合式AI策略,结合大...
AI研究的主要推动力会是什么?ChatGPT团队研究科学家:算力成本下降
OpenAI研究科学家Hyung Won Chung在斯坦福大学的演讲中探讨了AI研究的主要推动力,并通过Transformer的发展来阐释这一推动力。Chung认为,AI研究的核心推动力...
吴恩达:美国加州SB-1047法案,将扼杀开源大模型
美国加州议会在今年2月7日提出了《SB-1047前沿AI大模型安全创新法案》,经过多次修订和审议,该法案已经通过了一些关键条款,距离正式发布已经很近。该法案旨...
拯救Transformer推理能力!DeepMind新研究TransNAR:给模型嵌入「算法推理大脑」
DeepMind最近提出了一种结合Transformer和神经算法推理器(NAR)的混合架构方法,以解决Transformer模型在算法推理任务上的缺陷。这种新的架构被称为TransNAR...
苹果的大模型分层策略,实在是妙
苹果公司提出了一种基于Query难度的模型分发策略,该策略利用3B小模型、苹果大模型和GPT-4o来处理不同场景的任务。3B小模型主要应用于大多数场景,包括自动回...
GPT-4系列模型,在文档理解中的多维度评测
Snowflake的研究人员对OpenAI的GPT-4系列模型进行了深入研究,评估了其在文本生成、图像理解、文档摘要等方面的能力。通过在DocVQA、InfographicsVQA、SlideV...
一次性裁掉 50 多名副总裁!小扎的冷血管理哲学:高管也是打工人
Meta公司正在考虑裁减数百名副总裁,去年副总裁人数达到约300人,而扎克伯格希望将这一数字减少到250人。Meta的员工总数在多轮裁员后减少了约22%,截至2024年...
谢赛宁对话Sora 负责人:AI 视觉的基础是对压缩图像的学习
在这次深入的讨论中,Aditya Ramesh,OpenAI Sora及DALL·E团队的负责人,以及纽约大学助理教授谢赛宁,共同探讨了人工智能领域中语言和视觉模型的融合及其对...




