标签:AI模型
OpenAI自曝GPT-4.5马上发布、GPT-5免费无限用,推理模型o3-mini或成为绝唱|钛媒体AGI
OpenAI首席执行官萨姆·奥尔特曼宣布了GPT-4.5和GPT-5的发布计划,标志着公司技术路线图的重大调整。代号'猎户座'的GPT-4.5将在数周至数月内推出,成为最后一...
统一SAM2和LLaVA!字节豆包提出Dense Video多模态大模型Sa2VA
来自字节跳动、北京大学等机构的研究者提出了Sa2VA模型,这是首个结合SAM-2和LLaVA-like架构的视频多模态大模型。该模型通过整合时空细粒度理解能力,实现了...
DeepSeek劝不了谷歌们
过去一个月,DeepSeek以较低成本推出性能接近OpenAI o1的开源模型R1,引发了全球AI行业的震动。这一“小力出奇迹”的新范式挑战了行业对高昂研发成本的依赖,但...
今年,还要抢GPU?
近期国内AI初创公司DeepSeek凭借开源大模型DeepSeek-V3和DeepSeek-R1引发关注,其性能与GPT-4等顶级模型相当,但训练成本仅为560万美元,显著低于行业平均的1...
人类自愧不如 :DeepSeek R1、o3-mini和Gemini 2.0 思考过程大横评,AI们比你脑子清楚多了
本次评测针对o3-mini、DeepSeek R1和Gemini 2.0 Flash Thinking三款推理模型展开七项核心任务测试。逻辑推理测试中,三款模型均正确解答阶乘数列问题,但思维...
不断有人在问,这个中国模型到底有什么魔力?
低成本、高性能的AI模型开发方法正在全球范围内掀起新一轮技术热潮。通过李飞飞团队的研究以及上海交大团队的工作可以看出,利用Qwen作为基座模型,结合创新...
DeepSeek技术解析:如何冲击英伟达两大壁垒?
DeepSeek的V3模型通过557.6万美元的低成本训练实现了与OpenAI O1相近的性能,这一突破引发了对英伟达技术壁垒的重新审视。其核心创新在于基础模型能力的跃升...
DeepSeek-R1、o1都低于10%,人类给AI的「最后考试」来了,贡献者名单长达两页
随着人工智能技术的快速发展,评估前沿大语言模型能力的需求变得愈加迫切。为此,Center for AI Safety 与 Scale AI 共同开发了一个名为 Humanity's Last Exa...
网上关于DeepSeek的说法,哪些是错误的?
DeepSeek近期通过采用PTX编程优化了跨芯片通信能力,但这并不意味着它绕过了NVIDIA CUDA生态。PTX是CUDA编程模型的一部分,DeepSeek直接使用PTX编写程序,虽...
冲击DeepSeek R1,谷歌发布新一代Gemini全型号刷榜,编程、物理模拟能力炸裂
谷歌本周发布了新一代的AI模型系列Gemini 2.0,包括Gemini 2.0 Flash、Gemini 2.0 Flash-Lite和旗舰模型Gemini 2.0 Pro实验版本,并在Gemini App中推出了推理...