大模型
LLM,VLM,模型
全球首个对话式 AI 引擎发布,15分钟构建的AI对话1分钟不到1毛钱|钛媒体AGI
实时互动技术公司声网在北京发布了全球首个对话式AI引擎,该引擎具备650ms超低延时响应、优雅打断、全模型适配以及“选择性注意力锁定”功能,能够屏蔽95%的环...
DeepSeek创造历史!登顶全球AI应用第2名,豆包排名第10
全球著名投资基金Andreessen Horowitz(a16z)发布了2025年全球100生成式AI应用排行榜,分为网页版和移动版各50个应用。在网页版中,DeepSeek排名第二,仅次...
机器人到来前,智能汽车可能是更早服务人类的 AI Agent
在智能化转型的浪潮下,汽车行业正逐步深入AI领域,探索如何将AI技术与汽车产品深度融合。2025年被视为一个关键节点,众多车企纷纷接入DeepSeek等AI模型,宣...
杭州“六小龙”大火,用火山引擎开源AI预测杭州楼市,竟然挖到了这些关键数据!
最近,杭州“六小龙”板块的房地产热度持续上升,引发了广泛关注。作为一名科技博主,作者探索了如何利用AI工具进行专业研究报告的生成。通过火山引擎的“大模型...
强化学习成帮凶,对抗攻击LLM有了新方法
威斯康星大学麦迪逊分校的研究团队最近发现,强化学习可以被用于实施黑盒逃避攻击,即通过生成对抗样本来欺骗机器学习模型。这一发现揭示了强化学习在攻击AI...
仅1/70的数据量,多模态检索效果却更优! 智源发布BGE-VL,合成数据立大功
智源研究院联合多所高校开发了多模态向量模型BGE-VL,进一步扩充了BGE系列模型的生态体系。BGE-VL在图文检索、组合图像检索等主要多模态检索任务中均取得了最...
腾讯图生视频全面开源,更懂物理规律,一手实测来了
腾讯近日发布了其最新的图生视频模型,进一步补齐了其在视频生成领域的技术拼图。该模型与去年12月发布的文生视频模型HunyuanVideo一样,发布即开源,用户可...
国产 AI Infra 变革进行时:新势力正在崛起
DeepSeek 方法论在 AI 基础设施(AI Infra)领域的创新,推动了 AI Infra 软硬整合架构的突破,驿心科技便是这一趋势的代表之一。DeepSeek 近期开源了多个项...
DeepSeek的MLA,任意大模型都能轻松迁移了
DeepSeek-R1作为AI产业颠覆式创新的代表,其训练与推理成本仅为同等性能大模型的数十分之一,核心在于多头潜在注意力网络(MLA)。MLA通过对键值缓存进行低秩...
Manus:上帝之手
“抽象之梯”和“抽象泄漏”是两个值得深入探讨的概念,它们分别代表了语言抽象的不同层次和软件开发中的抽象化问题。抽象之梯由语言学家塞缪尔·早川提出,描述了...