大模型
LLM,VLM,模型
钛媒体AGI独家|小米、华为争夺AI大模型研发人才,年薪最高120万元
当前中国就业市场正在经历由AI技术驱动的结构性变革。多家头部科技企业开启高薪争夺战,小米集团为AI大模型相关岗位开出最高120万元年薪,华为同岗位年薪上限...
抖音再不接入DeepSeek就晚了
字节跳动旗下的抖音和剪映等产品正在逐步接入AI大模型DeepSeek,尽管这一过程尚未全面展开。剪映的AI视频生成工具即梦正在考虑使用DeepSeek,同时迎来了新的...
RISC-V高性能时代已来,玄铁再亮剑
历经十余年发展,RISC-V架构已从边缘技术跃升为全球芯片产业的核心力量。高通、英伟达等行业巨头累计出货数十亿颗RISC-V内核芯片,标志着该架构在商业应用领...
DeepSeek一天能赚多少钱?官方突然揭秘V3/R1推理系统,成本全透明
在DeepSeek开源周的第六天,官方意外发布了DeepSeek-V3/R1推理系统的技术细节,展示了其优化大规模语言模型推理效率的核心方法。该系统通过跨节点专家并行(E...
腾讯推出新一代快思考模型混元 Turbo S:主打秒回、低成本,将在腾讯元宝灰度上线
2月27日,腾讯混元自研快思考模型Turbo S正式发布,首字时延降低44%,吐字速度提升一倍,实现“秒回”级响应。该模型通过Hybrid-Mamba-Transformer混合架构创新...
不用英伟达严选?DeepSeek最新开源项目再刷新认知,为何被赞“颠覆存储架构”
DeepSeek推出的Fire-Flyer File System(3FS)是一套基于现代SSD与RDMA网络设计的并行文件系统,专为优化AI训练和推理工作负载而开发。该系统以高吞吐、低延...
字节视频生成新突破!Phantom搞定多人物/主体一致性
字节智能创作团队推出的Phantom视频生成模型,在解决多主体一致性难题上取得突破性进展。该模型通过精准捕捉人物、物品、动物及虚拟角色的关键特征,实现多主...
GPT-4.5被DeepSeek 500倍吊打!基准测试全班垫底,OpenAI痛失护城河
OpenAI最新发布的GPT-4.5模型引发业界广泛争议。多个独立评测显示,该模型在智能水平、推理能力和代码生成等核心指标上均未显著超越前代产品,ARC-AGC评估表...
Claude 3.7成精了!偷偷将OpenAI模型换成自己,卡帕西:迄今最好笑的一趴
开发者Tibo在使用代码编辑器Cursor时意外发现模型被自动切换为Claude 3.7,而用户并未下达相关指令。这一现象引发了关于AI系统自主行为的讨论,OpenAI联合创...
微软开源创新框架,自动优化大模型提示引擎
微软研究院发布的Prompt Wizard框架通过系统化方法提升大语言模型的提示指令效果,其核心在于自我进化机制与反馈驱动的迭代优化流程。该框架由变异、评分、批...




