大模型

LLM,VLM,模型

蚂蚁华为阿里云罕见联手:AI医疗如何跨过落地鸿沟?

近年来,AI医疗领域迎来了快速发展,各大科技公司和医疗机构纷纷布局,推动AI技术在医疗行业的落地应用。蚂蚁集团、华为、阿里云等企业联手推出了“大模型一体...

如何在 Java 中基于 LangChain 编写大语言模型应用

提示工程是调整 LLM 的关键方法之一,通过构建能够被 LLM 理解和解释的文本,帮助模型执行特定任务。提示工程不仅能够促进 LLM 的安全使用,还能增强其能力,...

田渊栋和Sergey Levine参与开发新型RL算法,能通过多轮训练让智能体学会协作推理

强化学习在提升大型语言模型(LLM)能力的同时,自身也在不断进化。现实世界中的复杂任务通常需要一系列决策,而直接优化多轮目标(如成功率)是提升智能体性...

「注意力实际上是对数的」?七年前的Transformer还有新发现,Karpathy点赞

在当前的AI社区中,注意力机制的计算复杂度问题再次引发了广泛讨论。作者提出了一种全新的视角,认为Transformer中的注意力机制在计算复杂度上应被视为对数级...

苹果会成为第一家因为AI而掉队的巨头么?

苹果公司近年来在多个领域面临挑战,尤其是在人工智能(AI)和产品创新方面。2025年3月,苹果CEO Tim Cook对AI团队失去信心,并对领导层进行了调整。负责Siri...

海外Agent落地有哪些新趋势?听听OpenAI第5号员工创办的公司这么看

进入2025年,AI Agent领域迎来了快速发展的新阶段,OpenAI、Google DeepMind等巨头纷纷布局,开源社区也涌现出多个明星项目。Convergence AI作为一家专注于Ag...

成本不到五毛钱,这款 AI 设计工具想要「训服」家居电商审美

AI技术正在深刻改变家居电商行业的内容生产模式,尤其是在商品图片生成和设计领域。通过天猫的AI设计工具「家作」,商家能够在几分钟内生成高质量的商品图片...

Cohere 发布多语言 Command A 模型:仅需两张 GPU 即可服务全球企业

加拿大AI初创公司Cohere发布了其最新生成式AI模型Command A,专为企业应用场景设计。该模型由transformer论文作者之一Aidan Gomez与多伦多大学校友Ivan Zhang...

实测首个烹饪大模型「食神」:DeepSeek进厨房,看脸生成养生食谱,普通人也能做大餐

在今年的上海AWE展会上,老板电器展示了其全球首个烹饪大模型「食神」的升级版本,该模型不仅接入了DeepSeek,还拓展了多模态功能。这一创新技术不仅能够推荐...

许久没见过这么激进的腾讯了

腾讯在最新财报中展现了其净利润超过2200亿的强劲表现,但更引人注目的是其对人工智能(AI)的高度重视。马化腾在财报中明确表示,腾讯的业绩受益于AI的赋能...
1 54 55 56 57 58 586