标签:多模态
极客说|微软 Phi 系列小模型和多模态小模型
本文介绍了微软在小模型(Small Language Models, SLMs)领域的研究成果,特别是Phi系列模型。随着大模型规模的扩大,训练和运行所需的计算资源日益紧张,小...
Sarah Guo总结2024年AI现状:应用层的价值被低估了
在NeurIPS 2024大会上,Conviction Capital的创始人Sarah Guo和合伙人Pranav Reddy深入探讨了AI创业公司的现状,并梳理出2024年AI领域的五大关键主题。这些主...
全面打破GPT-4垄断、DeepSeek打下训练成本…2024年大模型领域进展全复盘
2024年是生成式人工智能(AI)取得显著进步的一年,特别是在大型语言模型(LLM)领域。英国独立研究员Simon Willison回顾了过去一年中的关键发展和主题。以下...
拓元智慧完成近亿元人民币 Pre-A 轮融资
拓元智慧(X-Era AI)近期完成了接近一亿人民币的Pre-A轮融资,由粤科金融集团、鹏城愿景基金、红鸟启航基金等投资机构参与。该公司自2021年成立以来,专注于...
AI Agent 创新突破!从「耍嘴皮」到「看得见」,还能「动手干」
在AI技术飞速发展的背景下,无界方舟团队在极客公园IF2025创新大会上提出了“个人基础智能体”(Personal Foundation agent)的概念,为AI Agent的发展提供了新...
大模型圈最新现状:一半在用DeepSeek,另一半在玩“颜文字”?
近期,大模型领域出现了两个引人注目的焦点:DeepSeek和阿里通义千问开源的Qwen系列模型。阿里在9月发布了Qwen2.5系列,包含从0.5B到72B参数的多个版本,覆盖...
2024即将结束,中国AI应用支棱起来了吗?这家公司交出95分答卷
智象未来(HiDream.ai)是一家专注于视频和图像生成模型的公司,其核心团队自几年前就开始研究相关技术。公司最近推出了智象多模态生成大模型3.0版本和理解大...
Sam Altman发布2025年技术愿景,你想OpenAI怎么做?
Sam Altman在社交平台上分享了OpenAI的新一年技术愿景,并积极征求网友意见,引发了热烈讨论,评论数超过8300,浏览量破270万。他回应用户反馈积极,并肯定了...
o3 都要来了还能做点什么?人大&蚂蚁团队:自下而上数据合成让大模型能够多模态推理
中国人民大学高瓴人工智能学院与蚂蚁技术研究院的研究团队在EMNLP 2024上提出了一种视觉推理框架,旨在提升视觉语言模型的多模态推理能力。该框架基于“由浅入...
模型评测不是用来刷榜的,智源要用“辩论赛”的方式找回评测该有的样子
在人工智能国际顶会NeurIPS 2024上,大模型评测成为焦点,7000余篇投稿与之相关。去年,评测榜单因刷榜行为受争议,如C-Eval和SuperCLUE。评测大模型比构建更...