AI模型 | 第 4 页

下一个Transformer可能又被Google做出来了

当前顶尖大模型被比喻为患有顺行性遗忘症的患者，它们仅能依赖预训练阶段获得的'出厂知识'进行回应，而无法将交互中获得的新信息转化为长期记忆。Google研究...

AIGC动态

2个月前

源神阿里！图像生成Ovis-Image再开源，7B小参数媲美GPT-4o和20B开源模型

在人工智能领域，图像生成技术正经历着快速迭代。阿里推出的Ovis-Image模型以7B参数实现了媲美20B+开源模型和GPT-4o的文本渲染能力，证明了通过优化的架构设...

AIGC动态

3个月前

V3.2逼近Gemini 3，DeepSeek硬气喊话：接下来我要堆算力了

OpenAI前首席科学家Ilya Sutskever近期提出，过去五年依赖算力堆叠模型的'规模时代'正面临瓶颈，单纯扩大模型规模难以实现质变。然而DeepSeek通过V3.2系列模...

AI-Agent

3个月前

DeepSeek V3.2 正式版发布，V4 还没来，但已经是开源模型里 Agent 能力最强了

DeepSeek近日发布了V3.2正式版模型，包括DeepSeek-V3.2和DeepSeek-V3.2-Speciale两个版本。此次更新的核心在于推理能力和Agent工具调用能力的显著提升。其中...

AI-Agent

3个月前

DeepSeek-V3.2正式版发布，将开源模型的能力推向极致

DeepSeek团队正式开源了DeepSeekV3.2的两个版本：标准版和Speciale版。标准版专注于日常任务与通用智能体场景，在推理能力与输出效率之间取得了平衡，其性能...

AIGC动态

3个月前

脆弱性：AWS大中华区AI业务的「无妄之灾」与「待解之局」

Anthropic近期对中国企业发布的“AI断供令”直接导致AWS大中华区Bedrock平台下架Claude模型，引发连锁反应。作为AWS“AI大模型超市”理念的核心载体，Bedrock平台...

AIGC动态

3个月前

微软Fara-7B计算机操作模型，开启端侧智能代理新时代

微软发布了专为计算机操作设计的70亿参数智能代理Fara-7B，该模型通过纯视觉感知和合成数据训练，在端侧实现了高效能与安全性。与传统聊天机器人不同，Fara-7...

AIGC动态

3个月前

DeepSeek的模型，让AI第一次学会了反思。

DeepSeekMath-V2的发布标志着数学专用AI模型的重大突破。这个基于DeepSeek-V3.2-Exp-Base构建的685B参数模型，不仅能够解答数学问题，还能通过自我验证机制检...

AIGC动态

3个月前

Karpathy组建大模型「议会」，GPT-5.1、Gemini 3 Pro等化身最强智囊团

从短视频到AI模型，人们消费内容的习惯正快速向追求效率转变。在信息爆炸的时代，越来越多的人倾向于直接获取高密度、可快速吸收的知识，而非从头到尾浏览长...

AIGC动态

3个月前

Gemini 3 来了，AI 应用创业公司谁兴奋，谁冷静，谁觉得它不太行？

Gemini 3的发布引发了AI行业的多维度讨论，其能力拓展对创业公司的影响呈现两极分化。模型在视觉理解、代码生成和长任务处理上的突破，直接补足了Agent开发的...

AI-Agent

3个月前

标签：AI模型

下一个Transformer可能又被Google做出来了

源神阿里！图像生成Ovis-Image再开源，7B小参数媲美GPT-4o和20B开源模型

V3.2逼近Gemini 3，DeepSeek硬气喊话：接下来我要堆算力了

DeepSeek V3.2 正式版发布，V4 还没来，但已经是开源模型里 Agent 能力最强了

DeepSeek-V3.2正式版发布，将开源模型的能力推向极致

脆弱性：AWS大中华区AI业务的「无妄之灾」与「待解之局」

微软Fara-7B计算机操作模型，开启端侧智能代理新时代

DeepSeek的模型，让AI第一次学会了反思。

Karpathy组建大模型「议会」，GPT-5.1、Gemini 3 Pro等化身最强智囊团

Gemini 3 来了，AI 应用创业公司谁兴奋，谁冷静，谁觉得它不太行？

热门网址

标签：AI模型

Trae-AI IDE

讯飞星辰

讯飞文书-办公助手

有言AI-视频创作

热门网址