标签:小模型
3B打32B?海外病毒式传播的小模型,竟然来自BOSS直聘
当前全球大模型行业陷入参数量军备竞赛,不论开源还是闭源阵营都在疯狂扩张模型参数规模,2026年初发布的开放权重模型中,已有多个万亿参数产品,小模型十分...
开源中小模型+Skills也性能暴增!卢森堡大学探索了小模型驾驭Skills的边界
专注AIGC领域的专业社区,持续关注微软&OpenAI、百度文心一言、讯飞星火等大语言模型的发展与应用落地,聚焦大语言模型的市场研究及AIGC开发者生态。在此背景...
对话GameSkill陈迪:把世界冠军变成AI教练,塞进你的电脑里
在AI技术成为主流叙事、大模型与算力竞争白热化的背景下,一家名为GameSkill的公司选择以8B小模型实现端侧推理,聚焦电竞场景推出'1元1局'的AI教练服务。其核...
单个4090就能跑,Mistral开源多模态小模型,开发者:用来构建推理模型足够香
法国AI创企Mistral AI最近开源了一款名为Mistral Small 3.1的多模态小模型,该模型在多个基准测试中表现优异,超越了Gemma 3和GPT-4o Mini等同类模型。Mistra...
刚刚,谷歌用更少参数打败 Qwen 2.5-32B!新模型 Gemma 3 号称“单 GPU 模型王”,团队紧急招兵买马!
谷歌近日发布了Gemma 3,这是一组轻量级的开源AI模型,旨在减少能源消耗和成本,同时提供高性能的推理能力。Gemma 3基于与Gemini 2.0相同的研究和技术构建,...
DeepSeek推出后,移动端AI风向要变
高通凭借系统级芯片设计构建了技术护城河,其异构计算架构整合了NPU、GPU与低功耗子系统,能在保持设备续航的同时处理复杂推理任务。通过AI软件栈和开发者生...
微软首个多模态Phi-4问世,56亿参数秒杀GPT-4o!LoRA华人大佬带队
微软发布Phi-4系列两款新型模型——Phi-4-multimodal和Phi-4-mini,标志着小型语言模型(SLM)领域的重大突破。Phi-4-multimodal作为微软首个多模态模型,集成...
微软Phi-4家族新增两位成员,5.6B多模态单任务超GPT-4o,3.8B小模型媲美千问7B
微软于2024年底推出的Phi-4模型家族新增Phi-4-multimodal和Phi-4-mini两个成员,标志着小型语言模型在性能与效率上的重大突破。140亿参数的Phi-4使用40%合成...
极客说|微软 Phi 系列小模型和多模态小模型
本文介绍了微软在小模型(Small Language Models, SLMs)领域的研究成果,特别是Phi系列模型。随着大模型规模的扩大,训练和运行所需的计算资源日益紧张,小...
3B模型长思考后击败70B!HuggingFace逆向出o1背后技术细节并开源
近期,小模型的研究受到关注,因为通过实用技巧,它们在性能上有望超越更大规模的模型。这种趋势的背景是大语言模型训练所需的资源变得异常昂贵,而测试时计...
1
2




