大模型

LLM,VLM,模型

实测字节免费AI编程,还让不让Cursor活了

字节跳动推出的国内首个AI原生IDE产品Trae引发编程领域关注,该工具以深度理解中文开发场景为核心,通过自然语言交互实现零代码基础的应用开发。用户仅需用中...

DeepSeek-R1、o1都在及格线挣扎!字节开源全新知识推理测评集,覆盖285个学科

字节跳动豆包大模型团队联合M-A-P开源社区推出全新评测基准SuperGPQA,旨在解决当前大模型通用知识推理评估体系的局限性。该基准覆盖285个研究生级学科,包含...

智谱开源AI绘图CogView4,曾经的开源之光回来了。

近日,智谱与清华团队正式开源了AI绘图模型CogView4,成为首个支持中英文字直接生成的开源图像生成模型。该模型基于6B参数规模,支持最高2048像素分辨率的图...

谷歌开卷打工人!创始人让员工每天12小时,夺回AI地位!网友先怒了:像你一样在公司玩游戏吗?

谷歌联合创始人谢尔盖·布林近期要求员工增加工作时间并到岗办公,以加速通用人工智能(AGI)研发进程。他在内部备忘录中强调,每周60小时是效率最佳平衡点,...

在欧洲,没人提 DeepSeek

在2025年世界移动通信大会(MWC)上,人工智能成为各科技公司展示的核心主题。尽管机器狗等硬件设备吸引了观众注意力,但AI技术的应用与整合才是展会的真正焦...

2025,中国互联网公司们正重启一场“大乱斗”

中国互联网行业正经历新一轮深度变革,头部企业通过技术突破和战略调整重构竞争版图。阿里巴巴宣布投入3800亿元建设云与AI基础设施,明确将通用人工智能(AGI...

中科院、百度提出新架构:突破参数限制,实现高效推理

针对大模型参数规模扩大与性能提升不匹配的挑战,中国科学院信息工程研究所联合百度与北京师范大学AI学院提出了Inner Thinking Transformer架构(ITT)。该架...

多元推理刷新「人类的最后考试」记录,o3-mini(high)准确率最高飙升到37%

近年来,DeepSeek R1、OpenAI o1/o3等大语言模型在数学和编程领域的推理能力取得显著进展,但在国际数学奥林匹克竞赛(IMO)组合问题、抽象推理语料库(ARC)...

DeepSeek R1之后,基础模型要如何做商业化?

基础模型公司的商业化路径呈现多元化趋势,主要可分为四大方向。向应用方向发展的企业通过通用接口解决简单任务,但面临用户粘性差的核心挑战。 这类商业模式...

DeepSeek推出后,移动端AI风向要变

高通凭借系统级芯片设计构建了技术护城河,其异构计算架构整合了NPU、GPU与低功耗子系统,能在保持设备续航的同时处理复杂推理任务。通过AI软件栈和开发者生...
1 81 82 83 84 85 588