GPT-GPTs
GPT,GPTs,Prompt
英伟达nGPT重塑Transformer,AI训练速度暴增20倍!文本越长,加速越快
英伟达团队提出了一种新的神经网络架构——归一化Transformer(nGPT),这一架构在超球面上进行表示学习,能够显著提升大型语言模型(LLM)的训练速度,同时保...
硅谷深思:GPT应用迟未爆发,大模型泡沫根源初探
人工智能大模型行业在2022年取得了显著进展,特别是ChatGPT的推出,实现了大模型的Scaling law和通用能力涌现,商业化也取得了不错的进展。然而,OpenAI的发...
苹果一篇论文得罪大模型圈?Transformer不会推理,只是高级模式匹配器!所有LLM都判死刑
苹果研究者的最新研究对大型语言模型(LLM)的推理能力提出了质疑。研究发现,无论是闭源的OpenAI GPT-4o和o1模型,还是开源的Llama、Phi、Gemma和Mistral等...
苹果一篇论文把大模型圈子得罪了!“踩着”OpenAI、Meta大模型上位,Gary Marcus:早就说大模型不会推理!
苹果公司的六位AI研究人员发表了一篇论文,对当前领先的语言模型(LLM)进行了测试,以评估它们处理数学推理任务的能力。研究发现,即使是问题措辞的微小变化...
刚刚,OpenAI开放ChatGPT Windows版本,可像Office那样使用了
OpenAI最近宣布,为所有ChatGPT Plus、Enterprise、Team和Edu用户提供Windows桌面应用的早期版本。用户可以在微软应用商店下载该应用,并通过Alt + Space快捷...
GPU泡沫破灭前夜:2美元/小时出租,H100算力价格暴跌75%
AI产业的年产值被认为需超过6000亿美元才能覆盖AI基础设施的费用,如数据中心和GPU卡。尽管基础模型训练的资本支出被看作是快速贬值的资产,但对于GPU基础设...
英伟达开源最新大模型Nemotron 70B后,只有OpenAI o1一个对手了
英伟达最近开源了一款名为Llama-3.1-Nemotron-70B-Instruct的大型语言模型,该模型在性能上超越了OpenAI的GPT-4o和Anthropic的Claude-3.5 sonnet等竞争对手。...
H100 算力价格暴跌 75%,对 AI 创业公司意味什么?
AI产业的快速发展带来了对GPU基础设施的巨大需求,但随着市场的变化,这种需求可能正在经历泡沫。红杉资本的报告指出,AI产业的年产值需超过6000亿美元才能覆...
英伟达开源新王登基!70B刷爆SOTA,击败GPT-4o只服OpenAI o1
英伟达最近开源了一款名为Nemotron-70B的AI模型,该模型在多个基准测试中超越了包括GPT-4和Claude 3.5 Sonnet在内的140多个开闭源模型,仅次于OpenAI的o1模型...
2 美元就能用上 H100? 英伟达 H100 价格崩盘,集群投资血亏:GPU 生意还怎么玩下去?
H100 GPU的租赁价格在过去一年中经历了显著下降,从每小时8美元降至低于2美元。这一变化的背后是英伟达Blackwell系列的成功出货和市场供应过剩。尽管OpenAI等...