大模型
LLM,VLM,模型
LoRA中到底有多少参数冗余?新研究:砍掉95%都能保持高性能
LoRI 技术通过大幅减少 LoRA 的可训练参数,显著降低了大型语言模型微调的资源成本,同时保持了强劲的模型性能。 研究团队在数学推理、代码生成、安全对齐以...
Claude网页版接入MCP!10款应用一键调用,开发者30分钟可创建新集成
Anthropic公司近期宣布了其AI模型Claude的两项重要更新,进一步推动了MCP(模型上下文协议)的应用和发展。MCP作为一种通信协议,旨在实现大模型与外部数据源...
ICML 2025放榜!接收率26.9%,高分被拒,低分录用惹争议
第42届国际机器学习大会(ICML)将于2025年7月13日至19日在加拿大温哥华举行。今年大会共收到12107篇投稿,较去年增加了28%,其中3260篇论文被接收,接收率为...
“光靠人盯不住了”!拆解上万张晶圆,这家公司靠AI将芯片良率提升数个百分点
喆塔科技创始人兼 CEO 赵文政对半导体行业的 AI 应用充满信心,认为尽管目前国内真正跑通 AI 的半导体工厂不到 10%,但趋势不可阻挡。半导体工业的 AI 软件赛...
从游戏少女到AI女神!她用物理驯服AI,让飓风预测快1000倍
10岁的Rose Yu在25年前收到一台电脑,这份礼物彻底改变了她的命运。从最初的电脑游戏到网页设计,再到计算机科学的学习,她的兴趣逐渐转向了人工智能(AI)领...
被Transformer光芒掩盖的论文,Meta科学家回顾十年前创新之作
2015年发布的论文《End-To-End Memory Networks》虽然在当时被Transformer的光芒所掩盖,但它包含了当前大型语言模型的许多关键要素。这篇论文首次完全用注意...
又一开源AI神器!将机器学习论文自动转为可运行代码库
PaperCoder是一个多智能体大语言模型(LLM)系统,旨在自动生成机器学习论文中的代码。这一工具的推出源于对2024年NeurIPS、ICML和ICLR等顶级会议论文的统计...
AI泡沫要破?微软和Meta:继续奏乐继续舞!
微软和Meta在同一天公布了最新季度财报,尽管宏观经济前景不明,两家科技巨头的财报数据均超出了分析师预期,带动各自股价乃至AI股在盘后交易中上涨。微软第...
深夜突袭,DeepSeek-Prover-V2加冕数学王者!671B数学推理逆天狂飙
DeepSeek-Prover-V2的发布标志着数学推理领域的一次重大突破。该模型通过递归+强化学习的训练方法,显著提升了其在形式化定理证明中的表现。DeepSeek-Prover-...
Windsurf团队关于Agent的认知,相当精彩
Agent 系统的核心概念可以简单理解为一个接受用户输入,并交替执行两种调用的系统:大语言模型(LLM)和工具。LLM 会根据用户输入、上下文信息以及对话内容,...





