图像生成
图像,绘画
世界首个「实时、无限」扩散视频生成模型,Karpathy投资站台
Decart公司发布了全球首个实时、无时长限制且支持任意视频流的扩散视频模型MirageLSD,标志着AI视频生成领域的革命性突破。该模型能够在40毫秒的延迟内将任何...
MiniMax 技术闭门会分享:长上下文是 Agent 的 Game Changer
MiniMax在7月10日举办的M1技术研讨会汇集了全球顶尖的研究者和业界嘉宾,深入探讨了模型架构创新、RL训练、长上下文应用等前沿话题。RL能否赋予模型新能力?...
斯坦福开源复杂推理AI Agent,融合超10种工具
传统的AI助手通常依赖于单一模型或有限的工具集,难以应对需要多步推理、跨领域知识融合及高精度数据分析的任务。为了解决这一难题,斯坦福大学开源了OctoToo...
最强人才接连被挖,创业大佬离开 OpenAI 后说了实话:7 周硬扛出 Codex,无统一路线、全靠小团队猛冲
OpenAI研究员Jason Wei和Hyung Won Chung即将加入Meta新成立的超级智能实验室。Jason Wei曾在OpenAI参与o3模型和深度研究模型的开发,并专注于强化学习领域。...
Vibe Coding? Vibe over Coding! | 在Cursor中文社区的分享
在Cursor中文社区杭州线下活动中,硅星人主编王兆洋分享了将AI编程工具Cursor应用于高质量内容创作的实践经验。不同于常见的'小红书爆款批量制作'模式,该分...
刚刚,「吉卜力狂欢」GPT-4o功臣被挖走!华南理工女学霸曾与奥特曼同台
GPT-4o的发布引发了全球范围内的「吉卜力风格」热潮,吸引了超过1.3亿用户生成了逾7亿张图片。这一功能的成功离不开两位核心研究人员——华南理工学霸Lu Liu和...
不止AlphaFold,「药界ChatGPT」横空出世!华人女投资人深度揭秘
Chai Discovery的AI模型Chai-2在抗体设计领域取得了突破性进展,将成功率从0.1%提升至16%,并且实现了零样本生成。这一成就不仅标志着技术上的奇迹,更预示着...
阿里达摩院开源多模态医学大模型—灵枢
大模型在医疗领域的应用面临三大主要难题:医疗知识覆盖不足、幻觉风险高以及推理能力欠缺。为了解决这些问题,阿里巴巴达摩院的研究团队开源了统一多模态医...
AI们数不清六根手指,这事没那么简单。
在Grok4发布后,作者在社交媒体上发现了一个有趣的帖子,内容涉及AI模型在识别图像时出现的错误。作者测试了多个多模态模型,包括OpenAI o3、o3 pro、豆包、k...
MCP协议曝出大漏洞:会泄露整个数据库
最新研究揭示了MCP协议存在重大漏洞,攻击者可以利用大语言模型(LLM)的指令/数据混淆漏洞直接访问数据库。MCP协议作为智能体领域的行业标准,广泛应用于连...




