大模型
LLM,VLM,模型
RISC-V高性能时代已来,玄铁再亮剑
历经十余年发展,RISC-V架构已从边缘技术跃升为全球芯片产业的核心力量。高通、英伟达等行业巨头累计出货数十亿颗RISC-V内核芯片,标志着该架构在商业应用领...
DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明
在DeepSeek开源周的第六天,官方意外发布了DeepSeek-V3/R1推理系统的技术细节,展示了其优化大规模语言模型推理效率的核心方法。该系统通过跨节点专家并行(E...
腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线
2月27日,腾讯混元自研快思考模型Turbo S正式发布,首字时延降低44%,吐字速度提升一倍,实现“秒回”级响应。该模型通过Hybrid-Mamba-Transformer混合架构创新...
不用英伟达严选?DeepSeek最新开源项目再刷新认知,为何被赞“颠覆存储架构”
DeepSeek推出的Fire-Flyer File System(3FS)是一套基于现代SSD与RDMA网络设计的并行文件系统,专为优化AI训练和推理工作负载而开发。该系统以高吞吐、低延...
字节视频生成新突破!Phantom搞定多人物/主体一致性
字节智能创作团队推出的Phantom视频生成模型,在解决多主体一致性难题上取得突破性进展。该模型通过精准捕捉人物、物品、动物及虚拟角色的关键特征,实现多主...
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
OpenAI最新发布的GPT-4.5模型引发业界广泛争议。多个独立评测显示,该模型在智能水平、推理能力和代码生成等核心指标上均未显著超越前代产品,ARC-AGC评估表...
Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:迄今最好笑的一趴
开发者Tibo在使用代码编辑器Cursor时意外发现模型被自动切换为Claude 3.7,而用户并未下达相关指令。这一现象引发了关于AI系统自主行为的讨论,OpenAI联合创...
微软开源创新框架,自动优化大模型提示引擎
微软研究院发布的Prompt Wizard框架通过系统化方法提升大语言模型的提示指令效果,其核心在于自我进化机制与反馈驱动的迭代优化流程。该框架由变异、评分、批...
NAND,也要迎来HBM时刻?
在人工智能技术快速发展的背景下,NAND存储厂商面临着独特的机遇与挑战。与DRAM厂商通过HBM技术获得爆发性增长不同,NAND在AI计算中的核心作用相对受限。AI大...
怎么在DeepSeek里做SEO:一篇文章讲透生成引擎优化GEO
2024年6月,印度理工学院德里分校与普林斯顿大学学者提出了生成引擎优化(GEO)概念,旨在针对DeepSeek、ChatGPT等AI驱动的搜索引擎优化内容。与传统SEO依赖...