大模型

LLM,VLM,模型

3D 版 SORA 来了!DreamTech 推出全球首个原生 3D-DiT 大模型 Direct3D

DreamTech在2024年5月官宣了其开发的高质量3D生成大模型Direct3D,该模型采用原生3D-DiT技术,克服了3D内容生成领域的多项挑战。Direct3D通过3D VAE压缩3D数...

LLM最全「怪癖」首曝光!马里兰OpenAI等30+学者祭出75页提示报告

由马里兰大学、OpenAI、斯坦福大学、微软等12所机构的30多名研究者共同完成的一项大规模系统研究,首次深入探讨了大型语言模型(LLM)的提示技术,并发布了一...

“技术故障”背刺巴菲特,金融大模型到底靠不靠谱?

纽交所因技术问题导致巴菲特的伯克希尔-哈撒韦公司股价暴跌近100%,事后分析指向更新软件时的数据一致性问题和数据库问题。金证科技采用组合式AI策略,结合大...

AI研究的主要推动力会是什么?ChatGPT团队研究科学家:算力成本下降

OpenAI研究科学家Hyung Won Chung在斯坦福大学的演讲中探讨了AI研究的主要推动力,并通过Transformer的发展来阐释这一推动力。Chung认为,AI研究的核心推动力...

吴恩达:美国加州SB-1047法案,将扼杀开源大模型

美国加州议会在今年2月7日提出了《SB-1047前沿AI大模型安全创新法案》,经过多次修订和审议,该法案已经通过了一些关键条款,距离正式发布已经很近。该法案旨...

拯救Transformer推理能力!DeepMind新研究TransNAR:给模型嵌入「算法推理大脑」

DeepMind最近提出了一种结合Transformer和神经算法推理器(NAR)的混合架构方法,以解决Transformer模型在算法推理任务上的缺陷。这种新的架构被称为TransNAR...

苹果的大模型分层策略,实在是妙

苹果公司提出了一种基于Query难度的模型分发策略,该策略利用3B小模型、苹果大模型和GPT-4o来处理不同场景的任务。3B小模型主要应用于大多数场景,包括自动回...

GPT-4系列模型,在文档理解中的多维度评测

Snowflake的研究人员对OpenAI的GPT-4系列模型进行了深入研究,评估了其在文本生成、图像理解、文档摘要等方面的能力。通过在DocVQA、InfographicsVQA、SlideV...

一次性裁掉 50 多名副总裁!小扎的冷血管理哲学:高管也是打工人

Meta公司正在考虑裁减数百名副总裁,去年副总裁人数达到约300人,而扎克伯格希望将这一数字减少到250人。Meta的员工总数在多轮裁员后减少了约22%,截至2024年...

谢赛宁对话Sora 负责人:AI 视觉的基础是对压缩图像的学习

在这次深入的讨论中,Aditya Ramesh,OpenAI Sora及DALL·E团队的负责人,以及纽约大学助理教授谢赛宁,共同探讨了人工智能领域中语言和视觉模型的融合及其对...
1 554 555 556 557 558 777