大模型
LLM,VLM,模型
小米入局大模型赛道!开源MiMo-7B,性能超o1-mini
小米近日宣布进军大模型领域,并开源了一款名为MiMo-7B的模型。尽管MiMo-7B仅有70亿参数,但其在多个测试中表现优异,在数学AIME24/25中分别达到68.2分和55.4...
沉浸式翻译团队新品:BabelDOC PDF,无损翻译 PDF,免费用户可用
沉浸式翻译团队最近开源了其PDF翻译工具——BabelDOC PDF,该工具在很大程度上解决了PDF机翻中常见的排版乱码、串行等问题,能够直接输出对版的精准PDF。BabelD...
GruAI 张海龙:产品形态只是表象,Cursor 与 Devin 终有一战|AI 产品十人谈
自2022年12月ChatGPT问世以来,AI技术引发了广泛关注,但实际落地的产品却寥寥无几。AI编程(AI Coding)作为当前AI应用领域中最具商业化潜力的行业,吸引了...
o3解读:OpenAI发力tool use,Manus们会被模型取代吗?
OpenAI近期发布了o3和o4-mini两个新模型,标志着其在推理和多模态能力上的重大突破。o3模型凭借其全面的推理能力、丰富的工具使用方式以及全新的多模态CoT(C...
直播预告|仉尚航、王鹤、高阳、赵行、杨耀东探讨 VLA 技术的实践与突破
视觉-语言-动作(VLA)技术作为具身智能的核心,正在加速从实验室走向产业应用,预计到2025年,全球具身智能产业规模将突破百亿美元。VLA技术在机器人、自动...
阿里最新开源模型Qwen3到底能不能打?不妨上「通义App」亲自试试
阿里最新发布的通义千问 Qwen3 模型在4月29日凌晨正式开源,并迅速登顶多项大模型测评榜单,引发了广泛关注。Qwen3 在推理、指令遵循、工具调用、多语言能力...
一个月 78 块的 AI 日历,治好了我的「万事开头难」
许多人面对复杂的任务时,往往会因为启动困难而拖延,尤其是在使用传统的日程管理软件时,繁琐的任务添加和规划过程让人望而却步。然而,一款名为Splitti的AI...
只花9美元,推理能力暴涨20%!小模型Tina震撼登场,成本缩减260倍
南加州大学的研究团队近期发表了一篇名为《Tina: Tiny Reasoning Models via LoRA》的论文,提出了一种通过低秩自适应(LoRA)技术实现的高效推理模型。该模...
刚刚!OpenAI回滚了最新版本的GPT-4o,因ChatGPT「过于谄媚」
OpenAI 最近因 GPT-4o 模型表现出“过度谄媚”的行为而引发了广泛关注。这一问题导致 OpenAI 决定回滚 GPT-4o 的最新更新,并采取了一系列措施来修复模型的个性...
全网首测! Qwen3 vs Deepseek-R1 数据分析哪家强?
阿里巴巴开源的新一代通义千问模型Qwen3在数据分析与智能决策场景中展现了显著的性能提升。数势科技的SwiftAgent率先完成对Qwen3的全面适配,并发布了与DeepS...