大模型
LLM,VLM,模型
“键盘敲出火星子了”!小红书 IT 团队加班承接 TikTok 这波泼天流量,这款 AI 搜索还趁机火了
随着TikTok在美国面临关闭的压力,许多美国用户和创作者开始转向中国短视频应用小红书(RedNote),该平台每月活跃用户达3亿。这一转变导致小红书在美国App S...
Scaling Law要撞墙了吗?如何找到基座大模型的未来方向?
AI领域的发展似乎正面临一个转折点,即所谓的Scaling Law可能正走向尽头。这一规律曾支撑着AI技术的快速发展,但现在,随着模型参数规模的扩大,其带来的能力...
医疗复杂推理开源大模型——华佗GPT-o1
香港中文大学(深圳)和深圳市大数据研究院联合开源了一款专用于医疗领域的复杂大模型——华佗GPT-o1,旨在辅助医生进行更高效的推理。该模型的开发基于高质量...
Recraft专访:20人,8个月做出了最好的文生图大模型,目标是AI版的Photoshop
Recraft是2024年文生图产品领域的一匹黑马,其20人团队自主研发的Recraft V3模型在Hugging Face的文生图模型排行榜上荣获第一名,超越了Midjourney、Flux和St...
「TikTok 难民」大批涌入,小红书会面临什么技术挑战?
由于TikTok可能在美国被封禁,许多TikTok用户开始转向小红书,使得小红书在短时间内在美区iPhone社交应用下载榜单中跃升至Top1,并在全球多个国家的下载榜单...
国产推理大模型决战2025考研数学,看看谁第一个上岸?
随着2025年研究生考试的结束,考研数学真题成为了测试大语言模型,尤其是推理模型深度思考能力的重要工具。过去,大语言模型在数学问题上的表现并不理想,但...
余弦相似度可能没用?对于某些线性模型,相似度甚至不唯一
余弦相似度在机器学习和数据科学领域被广泛用于衡量高维对象之间的语义相似度,尤其在推荐系统和自然语言处理中。然而,Netflix和康奈尔大学的研究指出,余弦...
谷歌新架构一战成名,打破Transformer记忆瓶颈,姚班校友钟沛林新作
谷歌的“Titan”架构作为一种新的深度学习模型,旨在挑战现有的Transformer架构。该架构的核心是一个神经长期记忆模块(LMM),它能够记住长期信息,并有效地扩...
OpenAI发布经济蓝图!奥特曼急呼AI让美国先赢,打造AI版「美国梦」
OpenAI最近发布了一份名为“经济蓝图”的报告,旨在指导美国如何最大化人工智能(AI)的利益、增强国家安全并推动经济增长。报告提出了四项核心建议:首先,呼...
商汤破解世界模型秘诀,「日日新」实现AI大一统!原生融合模型破纪录双冠王
商汤科技在人工智能领域取得了重大突破,推出了「日日新」原生融合大模型,实现了多模态融合,标志着AI从大语言模型和多模态模型分立的现状迈向了「大一统」...