大模型

LLM,VLM,模型

DeepSeek V3“报错家门”:我是ChatGPT

近期,DeepSeek V3成为大模型圈的热门话题,但其存在一个bug,即在缺少问号的情况下,DeepSeek V3会错误地自称为ChatGPT。尽管有人怀疑DeepSeek V3可能基于Ch...

AISuite:一个新的开源 Python 库,提供了统一的跨 LLM API

吴恩达最近推出了`aisuite`,这是一个旨在为流行的大型语言模型(LLM)提供统一API的平台,类似于OpenAI的API。这个工具的目的是简化在同一个应用程序中使用...

算力直降97%,GPT-3存储只用20MB?!这篇直接在1.58-bit下训练模型的新论文火了

最近,一项名为“noise_step”的新技术由Will小哥提出,该技术允许模型在1.58-bit低精度下直接训练,无需反向传播或动量加速,从而大幅降低算力和存储消耗。这...

全球首个半导体大模型

Aitomatic及其AI联盟合作伙伴推出了SemiKong LLM,这是全球首个专为半导体行业设计的大型语言模型,旨在整合入半导体设计公司的工作流程。该模型基于Meta的Ll...

雷军千万年薪挖角95后天才少女,AI女神逆风翻盘!

中国大模型DeepSeek-V3的成功引起了业界的广泛关注,特别是其核心研究员罗福莉,一位95后AI领域的天才少女。罗福莉的成长历程充满励志色彩,从对计算机一无所...

你还说这是AI?我们体验了一波生成亚洲人最好看的文生图大模型

近期,社交媒体上热议的“ AI 模特”功能引起了广泛关注。这一功能由可灵 AI 提供,它能够一站式生成模特主体、换装、展示视频,其最新版本“可图 1.5”和“可灵 1...

一道题烧几千美元,OpenAI新模型o3:这34道题我真不会

OpenAI最近推出了新的推理系列模型o3和o3-mini,这是自o1以来的第12次更新。这些模型基于OpenAI提出的推理Scaling Law,为实现人工通用智能(AGI)带来了新希...

GPU营收,大增

Dell'Oro Group的数据显示,2024年第三季度,GPU和定制加速器组成的加速器收入增长了130%,美国超大规模企业如亚马逊、谷歌、Meta和微软预计将在2024年部署超...

北大数学家独作论文登数学顶刊!袁新意统一了算术与几何Bogomolov猜想

北京大学袁新意教授在数学界四大顶级期刊之一的《数学年刊》上发表了独作论文,该论文在解决困扰数学界多年的Uniform Bogomolov猜想问题上取得了重大进展。这...

商汤贾安亚:大模型未来趋势是让大家变成更会用 AI 的人

商汤科技Copilot产品负责人贾安亚在接受InfoQ采访时,分享了对大模型生产力工具市场发展、价值应用与未来趋势的见解。她指出,大模型技术难点包括数据的数量...
1 165 166 167 168 169 596