大模型
LLM,VLM,模型
苹果憋一年终超同参数 Qwen 2.5?三行代码即可接入 Apple Intelligence,自曝如何做推理
苹果在WWDC全球开发者大会上推出了新一代专为增强Apple Intelligence功能开发的基座语言模型。该模型家族包括一个约3B参数的紧凑型设备端模型和一个基于服务...
华为创造AI算力新纪录:万卡集群训练98%可用度,秒级恢复、分钟诊断
华为昇腾万卡算力集群实现了近乎'永不罢工'的稳定性能,其核心突破在于构建了三大智能保险系统。该系统通过全栈可观测能力实时监控集群运行状态,故障诊断组...
大模型是「躲在洞穴里」观察世界? 强化学习大佬「吹哨」提醒LLM致命缺点
加州大学伯克利分校副教授Sergey Levine近期提出一个核心疑问:为何语言模型通过预测下一个token能获得强大认知能力,而视频模型通过下一帧预测却收效甚微。...
让AI自己设计芯片!中国科学院发布「启蒙」,芯片全流程自动设计
中国科学院计算技术研究所与软件研究所联合推出的「启蒙」系统,标志着处理器芯片软硬件设计领域的一次重大突破。该系统基于AI技术,实现了从芯片设计到基础...
一块4090搞定实时视频生成!Adobe黑科技来了
近年来,视频合成技术取得了显著进展,但实时生成高质量视频仍然面临挑战。基于双向注意力机制的扩散 Transformer(DiT)能够生成复杂的时序动态内容,但其非...
一家中国公司,做了苹果AI该做的事。
今年的WWDC主题演讲中,苹果并未推出令人激动的AI新特性,但AI已逐渐融入手机的各个功能,如相册、翻译、电话和搜索,且这些功能大多通过端侧AI实现。端侧模...
我让10个大模型又参加了完整版数学高考,第一名居然是它。。。
在最近的一次测试中,多个大模型参与了数学高考的模拟考试,旨在评估它们在复杂数学问题上的表现。测试涵盖了单选题、填空题和解答题,特别关注了AI在处理高...
大芯片,巨变!
近年来,随着大芯片市场的快速发展,尤其是HPC和数据中心领域的需求激增,芯片行业的竞争格局发生了显著变化。过去,这一市场主要由英特尔、AMD和IBM等传统巨...
小红书开源1420亿参数大模型,部分性能与阿里Qwen3模型相当
小红书近期开源了其首个自研大模型dots.llm1,标志着其在AI领域的进一步探索。该模型由小红书hi lab团队开发,并在Github和Hugging Face等平台上发布。dots.l...
AI快进到补贴大战:从Perplexity到Gemini,都在等你白嫖
AI行业正在经历一场前所未有的补贴大战,各大科技公司和创业公司纷纷通过优惠和免费服务吸引用户。Perplexity、OpenAI、谷歌等公司通过提供一年Pro会员、首月...



