标签:大模型
出海应用也能享受高速稳定的DeepSeek-R1?亚马逊云科技出手了
DeepSeek-R1 作为生成式 AI 技术的核心,推动了新一轮 AI 技术的爆发,其强大的自然语言处理与推理能力为开发者提供了高性能、低成本的解决方案。然而,由于...
DeepSeek玩家能提前拿苹果新品!只要15万元,在家跑满血版R1
搭载M3 Ultra芯片的Mac Studio在本地运行满血版DeepSeek R1模型的表现引发了广泛关注。M3 Ultra作为苹果最新的高性能芯片,配备了32核中央处理器、80核图形处...
超越DeepSeek-R1关键RL算法GRPO,CMU「元强化微调」新范式登场
大语言模型(LLM)在推理领域的最新进展表明,通过扩展测试时计算可以显著提升模型的推理能力。OpenAI的o1系列等模型展示了这一潜力,尤其是在生成长推理链时...
新科研神器!这回读英文论文真跟读中文没两样了
翻译软件与大模型的结合,正在推动翻译领域的深刻变革。与通用大模型相比,翻译软件在垂直领域的语料积累和系统工程方面具有独特优势。百度翻译通过多年的技...
谷歌开源Gemma-3:媲美DeepSeek,算力暴降10倍
谷歌CEO Sundar Pichai宣布开源最新多模态大模型Gemma-3,该模型主打低成本高性能,共有10亿、40亿、120亿和270亿四种参数版本。即便最大的270亿参数版本,仅...
小红书基于 PPO 的多模态大模型 RLHF 系统的设计与优化
随着大模型技术从技术变革转向产业变革,传统基础设施技术已无法满足大模型应用的快速发展需求,整个基础设施技术和产业链正在向大模型基础设施技术转型。多...
张向征:大模型安全研究与实践
随着大模型在各行业的广泛应用,其作为数智化系统的关键基础设施,带来了显著的安全风险和技术挑战。360 智脑总裁张向征在 AICon 全球人工智能开发与应用大会...
LangChain创始人激辩MCP: 这是行业新标准,还是昙花一现?
Agentic AI 作为当前行业的热点,其核心问题之一是如何让大模型有效地调用工具。目前,主流的解决方案包括 computer/browser use 和 agent 协议,后者以 Anth...
独家对话姚欣:如果按DeepSeek高达545%成本利润率,全行业就都别干了|钛媒体AGI
DeepSeek作为中国开源大模型的代表,近期因服务器频繁崩溃引发广泛关注。3月11日凌晨,DeepSeek的R1网络/API服务再次出现不可用的情况,尽管问题在十多分钟后...
从「大模型」到「具身智能」,安克深耕前沿技术的另一面藏在这里
安克创新通过与北京大学的校企合作,深入探索大模型与机器人领域的结合,旨在推动智能硬件技术的创新与应用。安克创新高级副总裁 Frank Zhu 强调,公司并非局...