大模型
LLM,VLM,模型
OpenAI深夜发布3个全新的语音模型,一手实测都在这了。
OpenAI近期发布了一系列新的语音和文本处理模型,包括两个语音转文本(STT)模型和一个文本生成语音(TTS)模型。这些模型通过API提供接入方式,旨在提升语音...
硅基流动:关于 DeepSeek-R1 API 的评测,至少有 7 个误区
随着硅基流动等平台上线DeepSeek-R1,市面上出现了大量关于API服务的评测文章,但这些评测往往存在诸多误区,导致结论不一致甚至相互矛盾。评测API服务时,测...
三大模型巨头比拼思考「幻觉」:DeepSeek 不敌 ChatGPT,Gemini 用词最少
智利大学 CIAE 教育研究所的研究员 Roberto Araya 最近进行了一项关于大模型在应对幻觉问题上的性能对比研究,涉及 Gemini 2.0 Flash、ChatGPT o3-mini 和 De...
独家 | 前 TikTok 算法负责人陈志杰创立新公司「言创万物」,聚焦 AI Coding
陈志杰,前TikTok算法负责人,离职后创立了新公司“言创万物”,专注于AI Coding领域。该公司由陈志杰和原百度电商研发负责人刘晓春共同创立,陈志杰持股52.5%...
01年实习生被曝负责字节RL核心算法!系字节LLM攻坚小组成员
字节跳动与清华大学AIR联合实验室SIA Lab近期推出了一种名为DAPO的强化学习(RL)算法,该算法在AIME 2024基准测试中表现优异,超越了DeepSeek的GRPO算法。DA...
OpenAI加码写作赛道?阿里最新大模型通用写作能力基准WritingBench,揭秘深度思考能否增进文学表达
阿里研究团队联合中国人民大学和上海交通大学共同开发了WritingBench,这是一个全面评估大模型生成式写作能力的基准。该基准覆盖了六大领域和100个细分场景,...
一个算法让LLM创新能力暴增,原来是AI学会了进化
实验结果表明,Lluminate在纹理动画和时钟设计领域显著提升了新颖性。研究者通过比较不同配置的最终种群新颖性和基因组长度,发现使用进化提示词模式的变化(...
如何为预训练 LLM 添加新 token?
在预训练大模型(LLM)的微调过程中,添加新的 token 是提升模型在特定领域表现的关键步骤。这一操作不仅能够帮助模型更好地理解领域特定词汇,还能提高文本...
史上最贵 API!比 DeepSeek-R1 贵千倍,OpenAI 高价劝退一批用户!
OpenAI最近推出了o1-pro API,这是其o1“推理”系列模型的更强大版本,旨在提供更优的回答。该模型使用了更多的计算资源,但目前仅对在OpenAI API服务上花费至...
被谷歌点名感谢!杭州六小龙开源黑科技,让机器人瞬间「悟透」3D世界
群核科技近期开源了空间理解模型SpatialLM,该模型通过视频理解物理世界的几何关系,并将其转化为机器能读懂的指令,相当于教会机器用人类直觉感知世界。Spat...