大模型
LLM,VLM,模型
清北爸爸李永乐都搞不定的事情,这个隐身的大模型在发起挑战
本文讨论了当前教育领域大模型的发展以及猿辅导在这一领域的探索。首先,文章提到许多家长在辅导孩子作业时感到困难,而一些AI大模型如ChatGPT虽然可以提供答...
斯坦福AI团队“套壳”清华系开源大模型被实锤!被揭穿后全网删库跑路
斯坦福团队在Medium发布的文章中宣称,他们训练出了一个小型多模态模型Llama 3-V,其性能超越了GPT-4V、Gemini Ultra和Claude Opus等模型,且尺寸只有GPT4-V...
斯坦福爆火Llama3-V竟抄袭国内开源项目,作者火速删库
在GPT-4o问世后,Llama3的地位受到挑战。然而,斯坦福团队推出的Llama3-V引发关注,这一模型以仅500美元的成本,实现了与GPT4-V、Gemini Ultra和Claude Opus...
体验完字节所有的 AI 产品,杀手级 AI 应用可能比想象中更远
字节跳动在AI领域展现了其坚定的行动力,并通过全面布局寻找下一个杀手级应用。具体而言,字节跳动的AI产品线涵盖了多个领域,包括聊天、社交、图像视频、教...
超越Devin!姚班带队,他们创大模型编程新世界纪录
新入局的StarShip CodeGen Agent表现惊艳,以23.67%的成绩夺得全球第二的位置,这一成绩同时刷新了非GPT-4o基模的全球最高纪录。SWEBench评测被认为高度贴近...
英伟达最新GPU和互联路线图
Nvidia在计算、网络和图形发展史上占据独特地位,目前手握大量资金,并因其架构、工程和供应链优势在生成式人工智能市场处于领先。尽管起初Nvidia并无必要扩...
英伟达新研究:上下文长度虚标严重,32K性能合格的都不多
研究人员近日针对大型语言模型处理长文本的能力进行了深入探讨,并提出了名为RULER的新基准测试。该测试包含四大类共13项任务,旨在评估模型的“有效上下文”长...
重磅!斯坦福 AI 团队被曝抄袭中国大模型开源成果,推特舆论开始发酵
近期,斯坦福大学一个AI团队发布的名为“Llama3V”的模型引发了业界广泛关注。该模型以500美元的低成本,号称能达到与GPT-4V、Gemini Ultra及Claude Opus相媲美...
LLM的「母语」是什么?
在探索多语言大型语言模型(LLM)的内部工作机制时,研究人员好奇这些模型是否真的将英语作为其内部处理语言。来自洛桑联邦理工学院的研究人员对Llama 2家族...
活体脑细胞做成16核芯片,用Python就能编程,9个机构开展实验36所大学排队
瑞士生物计算创业公司FinalSpark推出了首个由16核类人脑器官组成的生物处理器,其功耗仅为传统数字处理器的百万分之一。这些类脑器官能在系统中存活长达100天...






