标签:硬件优化
「从追赶者到引领者,路有多远?」 我们和CANN一线开发者聊了聊
AI行业正经历从硬件算力竞争向软件、开发者与生态建设的转型,华为昇腾及其异构计算架构CANN成为这一变革的核心。2025年8月,华为宣布CANN将全面开源开放,标...
                    最新W4A4KV4全量化框架,单卡A100大模型推理速度飙升
王颖研究员团队联合华北电力大学和上海科技大学,在ASPLOS 2025会议上发布了COMET框架,该框架通过系统-算法协同优化,实现了权重、激活和KV缓存全4比特推理...
                    梁文锋亲自挂名,DeepSeek 最新论文丢出注意力新机制,推理速度直线提升 11 倍
DeepSeek研究团队近期发布了一种名为NSA的新型注意力机制,其核心设计包含动态分层稀疏策略、粗粒度token压缩与细粒度token选择三大技术要素。该机制通过优化...
                    DeepSeek满血微调秘籍来了,全网首发打破低价内卷!解锁升级版全家桶
Colossal-AI近期发布了开源大模型后训练工具箱,旨在帮助开发者通过低成本方式对DeepSeek V3/R1等大规模模型进行监督微调与强化学习优化。该工具箱支持高达67...
                    英伟达CUDA的护城河到底有多深?
英伟达(Nvidia)在GPU市场中面临来自英特尔和AMD的激烈竞争,这两家公司的新加速器在内存容量、性能和价格方面对英伟达的芯片构成挑战。英伟达通过近二十年...
                    ChatGPT一年电费高达2亿元,AI 为何如此耗电?| 钛媒体AGI深度
随着ChatGPT等人工智能技术的快速发展,其背后的能源消耗问题也日益凸显。Arm公司CEO哈斯预测,到2030年,AI数据中心可能会消耗美国20%至25%的电力,远超今天...
                    49152 个GPU!Meta最新算力集群曝光,扎克伯格:算力,算力,还是 Meta 的算力
Meta最近披露了两个新的GPU集群,用于训练下一代生成式人工智能模型,包括即将推出的Llama 3和其他领域的人工智能研究与开发。这两个集群在硬件、网络、存储...
                     
                             
                         
                             
                        





