标签:性能优化
DeepSeek引发推理侧革命,火山引擎凭什么做到最优解?
DeepSeek-R1作为新一代推理模型的代表,对云计算基础设施提出了全方位挑战,推动云服务商在性能、成本和稳定性等维度展开技术竞争。火山引擎凭借20ms内延迟响...
“2025 年将成 Python 主导 AI 领域的最后一年”
Java作为企业级应用领域的核心语言,正通过技术革新向AI领域发起冲击。Azul公司的调查报告显示,50%的组织已使用Java构建AI功能,在以Java为中心的企业中,其...
为了让DeepSeek-R1用起来更顺畅,火山引擎将TPM上调到了500万!全网首家
DeepSeek-R1模型在火山引擎平台上的部署与应用引发广泛关注。该平台凭借字节跳动的技术支撑,提供高达500万TPM(每分钟Token数)的初始限流配额,远超阿里云...
完整的671B MoE DeepSeek R1怎么塞进本地化部署?详尽教程大放送!
李锡涵在其AIxiv专栏中分享了如何将DeepSeek R1 671B模型部署到本地环境的详细教程。DeepSeek R1因其出色的性能而广受欢迎,但本地部署可以提供更个性化的服...
百万tokens仅需8毛,不蒸馏造出世界一流大模型,豆包全新1.5Pro不走捷径
随着春节的临近,国内AI厂商纷纷发布新一代大模型。豆包公司在春节前推出了实时语音功能,实现了中文语音对话的断崖式领先,为用户提供了智商与情商双高的实...
CUDA护城河,有多深?
Nvidia正面临来自英特尔和AMD的新加速器的激烈竞争,这些加速器在内存容量、性能和价格方面对Nvidia的最佳芯片构成挑战。Nvidia通过其CUDA运行时在开发者社区...
重磅!OpenAI开放满血o1模型API,成本暴降60%
OpenAI在技术分享直播中发布了o1模型的API,并进行了实时API的大升级,支持WebRTC技术。o1模型API相较于预览版本,思考成本降低了60%,并新增了高级视觉功能...
Sora发布!这次的惊艳居然不在模型,而是产品设计和制作流
OpenAI在发布会上推出了备受期待的视频生成模型Sora Turbo,这是对2月份Sora预览版的高端加强版,提升了速度并保留了“世界模拟”能力。Sora Turbo支持从文本和...
LeCun团队新作:在世界模型中导航
近期,AI领域的研究热点之一是世界模型(World Models),其中Meta FAIR的Yann LeCun团队发布了导航世界模型(Navigation World Models,NWM),这一模型能够...
智源发布心脏模型!超实时仿真人体生理功能,速度提升180倍
智源研究院开发了一种实时心脏电生理仿真系统,该系统能够实现心脏3D电活动的实时模拟,并深入探讨不同生理、病理因素对心脏功能的影响。这一系统在医学基础...