大模型
LLM,VLM,模型
Nature认证DeepSeek成科研工具全能者,国内高校如何借力大模型?
近年来,大模型在科研领域的应用深度显著提升,DeepSeek系列模型因其开源、低成本和高性能特点受到全球科研界关注。科学家们纷纷涌向DeepSeek,这种模型已成...
DeepSeek唤醒了腾讯
腾讯在AI领域的战略调整引发行业关注。面对AI技术浪潮,一贯以稳健风格著称的腾讯突然加速布局,从2024年2月开始,旗下微信、QQ浏览器、腾讯文档等14款产品在...
第一批DeepSeek开发者,已经开始逃离了
DeepSeek大模型服务中断事件引发开发者群体连锁反应。1月30日,北京开发者林森的程序因API调用失败瘫痪三天,随后发现DeepSeek暂停充值且未提前通知,导致其...
开发者,找找找丨 GDC 化身爱情孵化器 Love Combinator,助你「码」上脱单
全球开发者大会推出的'爱情孵化器 Love Combinator'活动,以技术手段重构开发者社交场景,试图破解程序员群体普遍面临的婚恋难题。通过分析1024位顶尖程序员...
高盛:DeepSeek等中国大模型,加速AI对全球GDP贡献
高盛最新研究报告指出,中国企业在生成式人工智能领域的技术突破正重塑全球AI发展格局。以深度求索(DeepSeek)为代表的中国科技公司开发出成本显著低于现有...
开发者,找找找丨千万粉丝女子电竞第一人同游GDC(限量粉丝福利)
2025全球开发者先锋大会宣布电竞行业标志性人物韩懿莹(Miss)将作为嘉宾出席,引发业界广泛关注。作为中国首位女子电竞世界冠军,Miss在职业生涯中斩获7项国...
高盛:DeepSeek等中国大模型,加速AI对全球GPD贡献
高盛发布的研究报告指出,中国企业在生成式人工智能领域的技术突破可能加速全球AI应用进程,并对经济增长产生深远影响。以深度求索(DeepSeek)为代表的中国...
钛媒体AGI独家|MiniMax副总裁魏伟离职,曾任腾讯云副总裁
中国AI大模型独角兽企业MiniMax(稀宇科技)合伙人、副总裁魏伟近期确认离职。公司回应称,国内B端业务将进入新阶段,由其他负责人接任,并强调技术能力提升...
梁文锋亲自挂名,DeepSeek 最新论文丢出注意力新机制,推理速度直线提升 11 倍
DeepSeek研究团队近期发布了一种名为NSA的新型注意力机制,其核心设计包含动态分层稀疏策略、粗粒度token压缩与细粒度token选择三大技术要素。该机制通过优化...
DeepSeek满血微调秘籍来了,全网首发打破低价内卷!解锁升级版全家桶
Colossal-AI近期发布了开源大模型后训练工具箱,旨在帮助开发者通过低成本方式对DeepSeek V3/R1等大规模模型进行监督微调与强化学习优化。该工具箱支持高达67...





