大模型
LLM,VLM,模型
DeepSeek 反思潮:AGI 既被重新审视,又被持续低估
DeepSeek的崛起引发中国大模型行业的深度反思与战略调整。技术突破超越产品更新成为企业战略优先级,Moonshot等公司开始将资源向基础模型研发倾斜,反映出行...
Karpathy更新AI科普视频,网友:原本周末打算结个婚,改看视频了
Andrej Karpathy发布了一部时长2小时18分钟的教学视频,系统性地解析大型语言模型(LLM)的实践应用方法。该视频以普通用户为对象,聚焦如何通过LLM提升工作...
「司闻智能」用 Sourcing Agent 解决 VC 项目搜索难题,致力于探索风险投资新模式
风险投资行业正经历由人工智能驱动的结构性变革。传统VC依赖人工项目搜寻(sourcing)和主观判断的模式面临效率瓶颈,VC模式的换代迎来了Deepseek时刻。司闻...
开源的胜利!RISC-V与AI今日全面「会师」
阿里达摩院在第三届玄铁RISC-V生态大会上宣布,首款服务器级处理器C930将于下月交付,其通用性能达到SPECint2006基准测试15分/GHz的关键门槛,标志着RISC-V正...
得一微发布AI-MemoryX显存扩展技术,助力DeepSeek训推一体机
得一微电子推出的AI-MemoryX显存扩展解决方案,通过自研存储控制芯片和系统级创新,将单机显存容量从传统显卡的几十GB提升至10TB级别,解决了大模型微调训练...
千呼万唤始出来的 GPT 4.5,主打的只是一个“大”
OpenAI于2月27日通过直播发布GPT-4.5,标志着其战略定位的重大转变。GPT系列不再作为公司前沿模型的核心,而是逐渐退居为支撑未来推理模型的“技术底座”。此次...
GPT-4.5 发布!OpenAI 史上最大最贵也可能是最慢那个,全网都在骂大街啦
OpenAI发布了GPT-4.5模型,目前以“研究预览”形式面向Pro订阅用户(每月200美元)和API开发者开放。该模型被官方称为“迄今知识最丰富的模型”,但明确强调其并...
7天完成1亿增长!超级产品DeepSeek高效使用全攻略
2025年1月下旬,DeepSeek-R1智能产品在发布后呈现爆发式增长。该产品在1月最后7天内实现1亿用户增长,累计用户达1.25亿,且未进行任何广告投放,成为人工智能...
DeepSeek开源最后一天,大鹏今日同风起。
DeepSeek在为期五天的开源项目发布中,最终推出了两款核心工具:分布式文件系统3FS与数据处理框架Smallpond。3FS专为AI模型训练与推理设计,采用分离式架构与...
英伟达“赚钱机器”更强了!盈利创纪录,黄仁勋:DeepSeek 为 GPU 降本,但下一代模型还离不开我
英伟达发布的最新财报显示,2024财年第四季度收入达到创纪录的393亿美元,环比增长12%,同比增长78%。其中,数据中心业务以356亿美元收入成为核心驱动力,环...