大模型
LLM,VLM,模型
字节开源图像编辑黑科技!1/30参数1/13数据,性能提升9.19%
字节跳动最近开源了一种新的图像编辑方法,名为SuperEdit,该方法在性能上比当前最先进的图像编辑方法提高了9.19%,同时仅使用了1/30的训练数据和1/13的模型...
大模型AI应用,正在企业级赛道迅猛爆发
大模型AI应用在消费级市场的爆发引发了广泛关注,但企业级大模型AI应用市场的潜力同样不容忽视。这一领域的需求明确且增长迅猛,AI、云计算和企业服务领域的...
Pokee.ai 朱哲清:用 RL 搭建智能体的「骨骼与神经」| AI 产品十人谈
朱哲清是一位坚定的强化学习(RL)信仰者,他早在2016年AlphaGo击败李世石时便意识到AI的潜力,并开始深入研究RL。尽管RL在随后的几年中经历了低谷,朱哲清始...
爆火的 AI 玩具赛道,全行业都在等一个「成功者」
近年来,AI玩具创业成为众多年轻人追逐的热点,尤其是在社交媒体和科技展会上,AI玩具相关话题和产品吸引了大量关注。许多创业者希望通过打造具备情感陪伴功...
关于 AI 编程的最本质提问:Cursor 到底有没有护城河?
Cursor作为一款AI驱动的代码编辑器,凭借其独特的产品体验和用户粘性,迅速在开发者工具市场中占据了一席之地。其核心优势在于以AI-first的方式构建,深度集...
一个LoRA实现GPT-4o级图像编辑!浙大哈佛新模型冲上Hugging Face榜二
基于文本指令的图像编辑任务一直是图像生成和编辑领域的热点,近年来随着Gemini、GPT-4o等商业大模型的推出,这一领域的技术水平不断提升。然而,传统方法通...
碾压Cursor?谷歌突发Gemini 2.5 Pro 预览版,编码能力全网第一
谷歌在年度I/O开发者大会前夕,发布了Gemini 2.5 Pro Preview(I/O版),这是其旗舰AI模型的升级版本。该模型在多项主流基准测试中表现优异,特别是在编程和W...
Gemini 2.5 Pro登顶三冠王!AI最强编程屠榜,全面碾压Claude 3.7
谷歌最新发布的Gemini 2.5 Pro Preview(I/O版)在多个领域取得了显著突破,尤其是在编程、视觉和文本处理方面表现卓越。该模型在LMeana基准测试中斩获三连冠...
机器人界「Sora」来了!清华、星动纪元开源首个AIGC机器人大模型,入选ICML2025 Spotlight
从2023年的Sora到如今的可灵、Vidu、通义万相,AIGC生成式技术在全球范围内迅速普及,推动了AI应用的落地。这一技术不仅在数字世界中展现了强大的生成能力,...
搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核
Cognition AI 近期开源了一款名为 Kevin-32B 的大模型,该模型通过强化学习技术专门用于编写 CUDA 内核。Kevin-32B 基于 QwQ-32B 模型,并在 KernelBench 数...





