GPT-GPTs
GPT,GPTs,Prompt
大模型预测,下一个token何必是文字?
近年来,人工智能技术的发展迅猛,特别是大模型在生成技能上的进步,已经达到了令人难以置信的水平。现在,大模型不仅能生成文字、图像和视频,还能基于历史...
基础模型、长文本、数据库、应用落地:读懂大模型行业的关键问题
2024年全球开发者先锋大会(GDC)2024年全球开发者先锋大会(GDC)在上海成功举办聚焦全球开发者精英,为中国大模型公司提供了展示最新科研成果和技术创新的...
再豪掷 198.8 亿元!亚马逊 30 年来最大手笔倾注 OpenAI 对家公司 Anthropic
亚马逊近日宣布,将向AI公司Anthropic追加投资27.5亿美元,以完成去年的投资协议,并扩大两家公司的合作关系。这笔投资使得亚马逊对Anthropic的总投资额达到4...
Anthropic找到了打败OpenAI的方法:自己也成为OpenAI
近期,Anthropic公司因其开发的人工智能模型Claude 3在Chatbot Arena排行榜上击败GPT-4,首次登上王位,引发了业界的广泛关注。亚马逊也对Anthropic进行了再...
马斯克官宣Grok-1.5!超GPT-4 16倍上下文,推理能力超DBRX,网友:赢在敢说!
马斯克最新发布的人工智能模型Grok-1.5,以其卓越的编码与数学处理能力、深入的上下文理解以及精准的长文本检索能力,引起了业界的广泛关注。Grok-1.5是Grok...
基础模型、长文本、数据库、应用落地……一篇文章读懂今天大模型行业的关键问题丨2024 GDC
2024年全球开发者先锋大会(GDC)在上海成功举办,聚集了众多国内外人工智能领域的前沿创业者和技术专家。本次大会由上海市人工智能行业协会(SAIA)主办,旨...
台积电董事长预测:未来15年每瓦GPU性能提升1000倍,GPU晶体管数破万亿!
本文主要讨论了半导体技术的发展对AI技术的推动作用,以及未来半导体技术的发展趋势。文章首先提到,过去25年,半导体工艺制程不断逼近极限,才有了ChatGPT的...
DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源
DeepMind最近提交的一篇论文《Long-form factuality in large language models》引发了热议。该论文提出了一种新的方法,可以对大语言模型的长篇事实性进行评...
首个基于SSM-Transformer混合架构,开源商业大模型Jamba
AI研究实验室AI21最近开源了其基于SSM-Transformer混合架构的商业大模型——Jamba。这个模型在传统的Transformer架构上加入了结构化状态空间模型 (SSM) 技术,...
谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力
本文主要介绍了谷歌Deepmind和南加州大学研究人员提出的一种用于大语言模型的通用框架——SELF-DISCOVER,它能自行发现任务内在的推理结构,以解决对典型提示方...