大模型
LLM,VLM,模型
网上晒图要当心!AI六成可能知道你在哪儿
AI在图像地理识别任务中表现出色,准确率远超人类,但也暴露了显著的偏差和隐私问题。 研究表明,视觉语言模型(VLMs)能够通过图像细节推断地理位置,表现最...
模型调优无需标注数据!将Llama 3.3 70B直接提升到GPT-4o水平
Databricks公司推出了一种名为TAO(Test-time Adaptive Optimization)的新型模型调优方法,该方法无需标注数据即可完成大型语言模型(LLMs)的微调。TAO的核...
AIGC第一股年报详解:AIGC业务暴涨88.5%营收2.2亿,95%智能硬件交付出海,跑通规模化「软件订阅+出海」
出门问问在2024年发布了其上市后的首份年度财报,展示了其在AIGC领域的显著进展和商业化成果。AIGC业务营收突破2.2亿元,同比增长88.5%,成为公司的主要增长...
吉卜力只是开胃小菜,GPT-4o一键抠图「换装换背景」!推理也初步显现
OpenAI的GPT-4o模型近期成为AI领域的热门话题,尤其是在图像生成和推理能力方面的表现引发了广泛关注。通过GPT-4o,用户能够生成吉卜力风格的图像和视频,甚...
面壁智能 CEO 李大海:AI智能体的未来是模型,而非工作流
面壁智能 CEO 李大海在中关村论坛上回应了关于端侧 AI 和端侧模型的热点问题。首先,他强调了端侧 AI 和端侧模型之间的本质区别。端侧 AI 更多强调的是在手机...
图灵奖得主预言中国成AI工业翘楚!海淀硬核AI先锋盛会,涌现更多未来成果
2025年中关村论坛人工智能主题日在北京海淀区隆重举行,标志着中国在全球人工智能领域的重要地位。此次论坛以「积淀·涌现」为主题,汇聚了全球顶尖的AI专家、...
业界突破多模态泛化推理能力,OPPO研究院&港科广提出OThink-MR1技术
OPPO研究院与香港科技大学(广州)的研究人员提出了一项名为OThink-MR1的新技术,旨在通过动态强化学习提升多模态大模型的泛化推理能力。多模态大模型虽然能...
智源研究院院长王仲远:至少5-10年,具身智能模型才能成熟落地|钛媒体AGI
在2025中关村论坛年会的“未来人工智能先锋论坛”上,智源研究院院长王仲远发布了跨本体具身大小脑协作框架RoboOS和开源具身大脑RoboBrain。这两款技术产品旨在...
每周宕机数十次,CEO 控诉“防护措施天天失效”:开源界正遭受 AI 公司的暴击
多个开源社区近期面临AI爬虫大规模抓取资源的问题,导致服务器频繁宕机或性能严重下降。SourceHut、GNOME、KDE、Inkscape、Fedora等社区纷纷发声,呼吁外界关...
“计算机视觉被GPT-4o终结了”(狗头)
GPT-4o原生多模态图像生成技术的出现,标志着计算机视觉领域的一次重大突破。该技术不仅能够生成高质量的图像,还具备语义分割、深度图生成等复杂功能,甚至...