标签:进化算法
性能不减,吞吐量提升6.4倍!英伟达用混合算子和架构定义小模型新标准
NVIDIA最新研究颠覆了传统小型语言模型的设计理念,参数数量减少不再直接等同于速度提升,关键在于模型架构与硬件特性的深度匹配。研究团队通过Nemotron-Flas...
AI地理学家诞生:麻省理工、斯坦福用多智能体框架重塑地理空间建模,刷新SOTA
GeoEvolve框架通过多智能体协同与知识引导的进化算法,实现了地理空间模型的自动化发现与优化。该框架由代码进化器、进化代码分析器、地理空间知识检索器和地...
将KV Cache预算降至1.5%!他们用进化算法把大模型内存占用砍下来了
键值缓存(KV cache)是大模型快速运行的核心技术,但存在输入文本越长、所需存储空间越大且处理长文本变慢的问题。现有 KV cache 压缩方法主要依赖基于规则...
一个算法让LLM创新能力暴增,原来是AI学会了进化
实验结果表明,Lluminate在纹理动画和时钟设计领域显著提升了新颖性。研究者通过比较不同配置的最终种群新颖性和基因组长度,发现使用进化提示词模式的变化(...
Liquid AI 发布新 STAR 模型架构,称比 Transformer 效率更高
麻省理工学院孵化的初创公司Liquid AI近期宣布了其在自动化神经网络架构设计和定制方面的重大进展。该公司开发了一种名为基于进化算法的定制架构合成(STAR)...
大模型融合!最新「进化算法」全自动组合开源模型,刷榜多项基准测试
Sakana AI团队开发了一种新方法,能够自动组合不同的开源模型,创造出具有新能力的AI系统。这种方法基于集体智慧的概念,即未来的人工智能将不是一个庞大的单...
离职谷歌的Transformer作者创业,连发3个模型(附技术报告)
去年8月,前谷歌研究人员David Ha和Llion Jones创立了位于日本东京的人工智能公司Sakana AI,其中Llion Jones是谷歌2017年经典研究论文《Attention is all yo...
模型合并就进化,直接拿下SOTA!Transformer作者创业新成果火了
这篇文章介绍了日本大模型公司提出的一种新颖的模型合并方法,旨在自动生成新的基础模型而无需进行梯度训练。他们使用进化算法引入了“进化模型合并”(Evoluti...





