大模型
LLM,VLM,模型
刚刚,OpenAI发布新文生图模型,免费、逼真到难以分辨
OpenAI在技术直播中发布了GPT-4和Sora的重大更新,重点介绍了全新的文生图模型。该模型不仅支持文本生成图像,还具备自定义操作、连续发问、风格转换、图像PP...
试了试 ChatGPT的图片生成功能,我佩服的无话可说
今天凌晨,ChatGPT正式发布了基于GPT-4o模型的原生图像生成功能,标志着其在图片处理能力方面的一次重要升级。这一功能的推出,不仅展示了OpenAI在多模态推理...
AI-Native游戏应该如何落地?看看这12款游戏是怎么做的
近年来,AI技术在游戏领域的应用逐渐增多,涵盖了派对游戏、恋爱模拟、剧情互动等多个品类,为传统玩法注入了新的活力。通过对11款AI驱动游戏的体验,发现开...
拾象科技万字详解MCP:Agentic AI中间层最优解,以及创业公司的三个机会
Anthropic推出的Model Context Protocol(MCP)在AI领域引发了广泛关注,尤其是在Agentic AI的中间层领域,MCP已经显著垄断了AI应用与工具之间的连接层。MCP...
微信聊天框内置元宝,超级 App 又一轮进化开始
微信近期在聊天界面内置了名为「元宝红包封面助手」的AI助手,该助手依托腾讯混元大模型,提供陪聊、答题、作图及定制红包封面等功能。这一举措标志着AI技术...
推理延展到真实物理世界,英伟达Cosmos-Reason1:8B具身推理表现超过OpenAI ο1
在基于物理世界的真实场景中进行视觉问答时,现有的AI模型往往无法识别出参考选项中没有最佳答案的情况。例如,当问题要求预测车辆接下来的行动时,预设选项...
Uni-3DAR用自回归统一微观与宏观的3D世界,性能超扩散模型256%,推理快21.8倍
创建和理解3D结构在科学研究中具有重要意义,它不仅承载了丰富的物理与化学信息,还为解构复杂系统、进行模拟预测和跨学科创新提供了重要工具。随着AI技术的...
“不用高级GPU”!蚂蚁用国产AI芯片狂降百万训练成本,模型性能还与DeepSeek相当
蚂蚁集团在人工智能领域取得了显著进展,通过使用国产芯片和优化技术,成功降低了人工智能模型的训练成本。具体而言,蚂蚁集团在训练“专家混合”(MoE)模型时...
32B本地部署!阿里开源最新多模态模型:主打视觉语言,数学推理也很强
阿里通义千问Qwen发布了最新视觉语言模型Qwen2.5-VL-32B-Instruct,进一步扩展了其开源家族的产品线。该模型在尺寸和性能之间取得了平衡,能够在本地运行,并...
DeepSeek V3“小版本升级”实测堪比V3.5,非推理模型也有“啊哈时刻”,7米甘蔗过2米门想通了
DeepSeek V3-0324的发布虽然被官方称为“小版本升级”,但实际表现却远超预期。该版本在多个测试中展现出显著的能力提升,尤其是在复杂问题的处理上。例如,在4...