AI每日精选摘要

AI精选资讯3小时前更新 admin
9,587 5 5
AI每日精选摘要

❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️


◈ 07月27日 星期六 【 3 篇 】

OpenAI的《Her》难产,是被什么困住了手脚?


OpenAI的GPT-4o模型虽然在5月14日的发布会上展示了出色的实时音视频对话能力,但至今仍未公开发布。推迟的原因包括法律纠纷、安全问题以及技术挑战。法律纠纷主要涉及语音音色的版权问题,而安全问题则需要确保对话模式不会被用于诈骗等不当用途。技术挑战则包括实现低延迟、多设备适配、应对多种网络条件和嘈杂环境等。
GPT-4o的发布会演示效果虽然令人印象深刻,但存在一些限制,如需要固定网络、设备和物理环境。此外,视频通话部分的延迟问题也显而易见。对于室外场景,网络信号不稳定和噪音问题可能会影响AI的语音识别和回答。多设备适配也是一个挑战,目前OpenAI主要使用新款iPhone Pro进行演…

来源:AI每日精选摘要  量子位

芯片巨头,新豪赌


随着生成式AI技术的发展,全球芯片行业迎来了新一轮的投资热潮。各大芯片制造商如台积电、英特尔、三星等纷纷扩大资本支出,以应对日益激烈的市场竞争。英特尔在2021年提出了IDM2.0战略,核心是英特尔晶圆代工服务(IFS),并进行了大规模投资,包括建设新的晶圆厂和升级现有设施。台积电则在2024年提出了”晶圆代工2.0″概念,将晶圆代工行业的定义扩展到封装、测试、掩模制作等环节,并专注于先进封装技术。
为了满足市场需求,台积电在2024年第二季度的收益电话会议上宣布,将资本支出预计提高到300亿至320亿美元,其中大部分将用于先进工艺技术。台积电董事长魏哲家表示,增加资本支出的主要原因是看到…

来源:AI每日精选摘要  半导体行业观察

反转了?在一场新较量中,号称替代MLP的KAN只赢一局


多层感知器(MLP)作为深度学习模型的基本组成部分,在机器学习领域具有不可替代的地位。然而,MLP存在一些局限性,如难以解释的表示和网络规模的扩展困难。Kolmogorov–Arnold Networks(KAN)作为一种创新的替代方案,以其准确性和可解释性优于MLP而受到关注。尽管如此,关于KAN和MLP的选择仍存在争议。
新加坡国立大学的研究者在控制参数或浮点运算(FLOP)的条件下,对KAN和MLP在不同领域的任务进行了全面比较。结果表明,KAN仅在符号公式表示任务中优于MLP,而在其他任务中通常不如MLP。KAN的优势源于其使用的B样条激活函数。当MLP使用B样条激活函数替代原有激…

来源:AI每日精选摘要  机器之心

◈ 07月26日 星期五 【 10 篇 】

12h订单破万,卖爆了的国产AR眼镜公司什么来头?


Rokid,一家成立十年的人机交互公司,已逐渐成为AR领域的代表。公司发布了多款To B和To C硬件产品,引领了国内AR分体式设计趋势,并自研了XR原生OS系统,构建了国内最大的AR开发者社区。在市场份额、用户体量和消费级终端出货量方面,Rokid均位居国内第一。此外,Rokid还与国内200多家博物馆和景区合作,拓展了AR+文博行业场景。
最近,Rokid推出了AR Lite新品,其在7月25日的官方新品上市直播中,吸引了5万人在线观看,12小时内销量破万。Rokid创始人兼CEO Misa宣布发放F码,抢到F码的用户可以再减1000元,首批F码在不到10分钟内被抢完。Rokid AR…

来源:AI每日精选摘要  量子位

智谱的视频模型来了,它远非Sora,但却让这家公司更像OpenAI|对话智谱AI CEO 张鹏


智谱AI旗下的“智谱清言”App于7月26日推出了AI视频生成功能“清影”,面向所有用户开放,无需预约。清影基于智谱自研的视频生成大模型CogVideoX,技术优化后,理论上能在30秒内生成6秒长、1440×960分辨率的视频。该模型不同于Sora的DiT架构,采用融合文本、时间、空间三个维度的transformer架构,展示了写实风格、艺术风格、脑洞类等多种视频生成效果。
清影的视频生成模型在指令跟随方面表现出色,得益于智谱AI的语言模型所具备的语言理解能力。此外,清影整合了智谱清言的其他AI功能,提供从创意构思到成品发布的一站式服务,包括AI搜索收集素材、AI撰写文案和脚本、生成视频以…

来源:AI每日精选摘要  硅星人Pro

智谱 AI 张鹏:「清影」和 Sora 有不少差距,我们在用自己的方式往前追


智谱AI于7月26日发布了其视频生成产品——智谱清影(Ying),该产品现已全面上线官网及移动端,所有用户无需预约即可使用。免费用户可以不限次数地生成6秒时长、1440×960分辨率、6fps帧率的视频。智谱清影不仅支持文生视频,还支持图生视频和视频生成视频。此外,清影API也已上线大模型开放平台bigmodel.cn,开发者可以通过调用API体验和使用文生视频及图生视频的模型能力。
智谱清影在风景、动物、超现实、人文历史类需求上表现突出,同时支持皮克斯风格、卡通风格、摄影风格、动漫风格等多种风格。在镜头效果上,近景表现最佳,而在实体生成上,动物的表现优于植物、物品、建筑和人物。智谱清影还…

来源:AI每日精选摘要  Founder Park

奥特曼进军搜索,谷歌慌了!让谷歌股价暴跌的“大杀器”三个月前就被程序员摸透了!


OpenAI 近日宣布推出一款名为 SearchGPT 的 AI 驱动搜索引擎,该引擎能够实时访问互联网信息,并通过一个大型文本框询问用户“您在寻找什么?”与传统搜索引擎不同,SearchGPT 不仅提供链接列表,还试图对信息进行整理和解释。例如,用户搜索特定音乐节信息时,SearchGPT 会提供实时信息和来源链接。此外,该引擎还能解释何时种植西红柿等具体问题,并允许用户在结果出现后继续提问或点击侧边栏打开其他相关链接。
SearchGPT 还具备“视觉答案”功能,展示由 OpenAI 的 Sora 生成的 AI 视频,但具体工作原理尚未详细解释。目前,SearchGPT 仅是一个原型,…

来源:AI每日精选摘要  AI前线

智谱AI杀入视频生成:「清影」上线,时长6秒,免费不限量


智谱AI近期推出了一款名为「清影」的视频生成大模型,标志着公司在视频生成领域的重大进展。该模型能够根据用户简短的创意描述,在30秒内生成1440×960分辨率的高精度视频。用户可以通过清言App全方位体验「清影」的对话、图片、视频、代码和Agent生成功能,也可以在AI动态照片小程序上为手机照片添加动态效果。
「清影」生成的视频时长为6秒,所有用户均可免费使用。智谱AI表示,随着技术发展,「清影」的生成能力将很快应用于短视频制作、广告生成甚至电影剪辑等领域。在研发过程中,Scaling Law在算法和数据两方面发挥了重要作用,智谱AI CEO张鹏表示,随着算法和数据的不断迭代,相信Scal…

来源:AI每日精选摘要  机器之心

谷歌AI一分之差痛失IMO金牌!19秒做一题碾压人类选手,几何AI超进化震撼评委


谷歌DeepMind的人工智能系统在国际数学奥林匹克竞赛(IMO)中取得了显著成绩,其中AI系统AlphaProof和AlphaGeometry 2成功完成了6道题目中的4道,获得了相当于银牌的最高分28分,仅差1分即可获得金牌。这一成绩在609名参赛选手中表现突出,其中只有58人获得了金牌。
AlphaProof是一个基于强化学习的形式数学推理系统,能够在Lean的形式化语言中证明数学命题。它结合了预训练的大语言模型和AlphaZero强化学习算法,通过微调Gemini模型将自然语言问题陈述自动翻译成形式化陈述,建立了一个包含不同难度的形式化问题的大型库。AlphaProof在解题时会生…

来源:AI每日精选摘要  新智元

奕斯伟董事长王东升:看好RISC-V,推动新一代数字基础设施生态落地


RISC-V架构经过多年发展,正逐渐成为全球芯片行业的重要力量。根据Omdia的研究预测,RISC-V芯片在21世纪20年代将占据全球市场的显著份额,预计到2030年市场份额将接近25%,且在2024年至2030年间,基于RISC-V的芯片出货量将保持每年50%的增长速度,2030年达到170亿颗的出货量峰值。RISC-V之所以受到青睐,不仅因为其精简、开放、模块化和可扩展的特性,还因为其低功耗特点,使其在人工智能等新兴领域具有广泛的应用潜力。
北京奕斯伟计算技术股份有限公司作为RISC-V架构芯片与方案提供商的代表,自2019年成立以来,致力于推动RISC-V架构的自主研发和规模化应用。…

来源:AI每日精选摘要  半导体行业观察

芯片行业,好了吗?


近期,半导体行业经历了剧烈波动,市值大跌。一方面,特朗普政府的政策对芯片行业产生了负面影响;另一方面,海外芯片巨头发布的财报显示业绩不佳,进一步加剧了市场的不确定性。荷兰芯片制造商NXP公布的第二季度收入同比下降5%,其中汽车部门收入下降尤为严重。NXP的业绩不佳给整个行业敲响了警钟,尽管公司管理层试图通过调整策略寻找新的增长点,但市场对其前景仍持谨慎态度。
与此同时,德州仪器(TI)的财报虽然显示收入和利润双双下降,但公司管理层对市场复苏的预期给行业带来了一丝信心。TI首席执行官表示,尽管工业和汽车市场仍在下滑,但其他终端市场已开始恢复增长。此外,中国作为全球最大的半导体市场,在电子产品…

来源:AI每日精选摘要  半导体行业观察

俞敏洪想要一份体面


东方甄选与董宇辉的合作关系在7月25日画上句号。根据知情人士透露,东方甄选不仅免除了董宇辉的违约金和竞业协议,还提供了场地、人员以及供应链管理系统。董宇辉的新团队供应链人员是从东方甄选调过去的,双方直播带货同款产品不会存在违约问题。东方甄选公告称,董宇辉不再担任公司雇员及高级管理层,与辉同行公司将“出售”给董宇辉个人,资金来源于俞敏洪及公司的赠予。

俞敏洪通过公开信和抖音声明,明确表示除了已支付的待遇外,与辉同行的全部净利润将奖励给董宇辉,股权购买款也已安排支付。俞敏洪直言“宇辉购买公司的钱我安排了,公司是送给宇辉的。”董宇辉在东方甄选的收入结构已逐渐演变为保底+佣金,以及公司高层的…

来源:AI每日精选摘要  虎嗅APP

Nature 重磅论文:用 AI 生成的数据训练 AI,会让大模型崩溃


最新研究揭示了使用人工智能(AI)生成的数据训练AI模型可能带来的风险。研究发现,如果AI模型使用自动生成的数据进行自我训练,可能会导致模型崩溃,即模型性能严重退化,最终输出内容变得毫无意义。这种现象被称为“模型崩溃”,在大型语言模型(LLM)、变分自编码器(VAE)和高斯混合模型(GMM)中都可能发生。
研究指出,随着技术的发展,高质量数据变得越来越重要。然而,当前许多AI模型的训练依赖于从互联网上抓取的数据,这些数据很可能已经被前辈模型生成的内容所污染。如果一个模型的训练数据大部分来自前代模型生成的文本,随着版本的迭代,模型的性能可能会逐渐下降。
实验表明,当模型使用前代模型生成的数…

来源:AI每日精选摘要  Founder Park

◈ 07月25日 星期四 【 9 篇 】

C 端太卷,转战企业级应用,大模型与业务场景之间的差距到底有多大?


在当前的大模型市场中,to B(面向企业)端的AI应用正受到越来越多的关注。与面向个人消费者的to C端AI工具相比,to B端AI能够为企业提供更全局性的生产力和生产效率认知。微盟集团AI负责人裘皓萍在媒体交流会上表示,个人对AI的拥抱程度千差万别,而企业级AI可以让全员100%使用AI提效。
自2023年5月发布以来,微盟的大模型应用产品WAI通过开源自研和与国内大模型平台合作,不断迭代技术能力和应用场景。截至2024年5月,WAI已在SaaS场景下拓展超过50个真实商业应用场景,覆盖多个行业。在营销方面,WAI提供广告物料制作、精准投放、直播数字人等多维度AI技术支持,智能创作能力覆…

来源:AI每日精选摘要  AI前线

Nature封面:AI训练AI,越训越离谱


最新研究在《自然》杂志上发表,指出使用AI生成的数据训练大型模型可能导致模型崩溃。牛津大学等机构的研究表明,过度依赖自动生成的数据会使AI模型在几代内退化成胡言乱语。研究强调了原始数据源和数据过滤的重要性,以避免自我训练导致的模型崩溃。
模型崩溃是指AI模型在生成的数据上过度训练,导致不可逆转的退化。大型语言模型(LLM)需要大量数据训练,但如果忽略部分数据,模型可能只针对部分数据训练,最终导致崩溃。崩溃分为早期和后期阶段,早期模型在少数数据上表现下降,后期则完全崩溃。
模型崩溃的主要原因包括统计近似误差、函数表达误差和函数逼近误差。这些误差在几代模型中累积,导致与原始模型的偏差。研究还…

来源:AI每日精选摘要  机器之心

字节大模型同传智能体,一出手就是媲美人类的同声传译水平


近年来,人工智能在自然语言处理领域取得了显著进展,但同声传译(Simultaneous Interpretation, SI)依然是一个挑战。传统的同声传译软件通常采用级联模型,先进行自动语音识别(ASR),再进行机器翻译(MT),但这种方法存在错误传播问题,导致翻译质量下降。为了解决这一问题,字节跳动 ByteDance Research 团队推出了一款名为 Cross Language Agent – Simultaneous Interpretation (CLASI) 的端到端同声传译智能体,其翻译效果已接近专业人工水平。
CLASI 采用了端到端的架构,避免了级联模型中的错误传播…

来源:AI每日精选摘要  机器之心

两天内,Meta 和 Mistral 两款主流大模型打擂台!已经不仅卷性能了,谁更便宜就用谁?


法国AI初创公司Mistral发布了其旗舰级开源模型Mistral Large 2,拥有1230亿个参数,与Meta和OpenAI的最新模型在代码生成、数学和推理方面表现相当。Mistral Large 2在一些基准测试中展现了性能和成本优势。该模型仅授权非商业研究用途,商业应用需付费许可。
Mistral Large 2的上下文窗口增至12.8万个token,支持数十种新语言,包括葡萄牙语、阿拉伯语、印地语等。该模型适合需要强大推理能力或高度专业化任务的场景,如合成文本生成、代码生成等。
Mistral Large 2在训练过程中重点关注减少模型幻觉问题,使其能更敏锐地意识到自己不知道…

来源:AI每日精选摘要  AI前线

AI训AI惨遭投毒9次大崩溃,牛津剑桥等惊天发现登Nature封面!


牛津、剑桥、帝国理工和多伦多大学等机构的研究人员在《自然》杂志上发表的一篇论文中指出,使用人工智能(AI)生成的数据训练AI模型可能导致模型崩溃,即模型出现不可逆转的缺陷,原始内容分布的尾部(低概率事件)会消失。这种现象在大型语言模型(LLM)、变分自编码器(VAE)和高斯混合模型(GMM)中都可能发生。研究者认为,合成数据就像近亲繁殖,会产生质量低劣的后代。
研究人员发现,如果在训练中不加区别地使用AI产生的内容,模型就会出现模型崩溃现象。例如,使用维基百科文章训练的模型OPT-125m,在前一代模型生成的文本上训练多代模型后,输出结果逐渐变得胡言乱语,与原始素材无关。此外,基于AI生成…

来源:AI每日精选摘要  新智元

Llama 3.1横空出世!开源巨无霸首次击溃闭源,全民GPT-4时代来临


Llama 3.1 405B模型的发布标志着开源人工智能领域的一个重要里程碑。这一模型在多项基准测试中超越了现有的闭源模型,如GPT-4o和Claude 3.5 Sonnet,成为目前最强大的模型之一。LeCun总结了Llama 3.1模型的关键特点,包括与顶尖闭源模型相媲美的性能、开源免费使用权重和代码、支持微调和蒸馏、以及128k的上下文长度等。此外,Llama 3.1还具备多语言能力、良好的代码生成能力和复杂推理能力。

Meta CEO小扎在博客中强调了开源AI的重要性,将其比作Linux的胜利,认为开源AI将推动行业发展。他指出,开源模型允许开发者自由地训练、微调和蒸馏自己的…

来源:AI每日精选摘要  新智元

横店,到底相不相信AI?


横店,中国著名的影视拍摄基地,正在经历一场由人工智能(AI)技术引发的变革。这场变革主要体现在短剧的制作和投放两个环节。在制作端,短剧制造者们对AI技术的兴趣并不大。他们更倾向于依靠传统的生产流水线,通过实拍的方式,快速制造出大量短剧。这些短剧通常情节简单、制作周期短,能够迅速满足市场需求。然而,在投放端,AI技术的应用已经开始显现出其优势。
短剧的投放成本占据了总成本的80%~90%,是决定短剧成功与否的关键因素。传统的投放方式需要剪辑手和投流手的紧密配合,通过不断测试来找到最佳的投放方式。然而,这种方式不仅成本高昂,而且效率低下。现在,一些公司开始尝试利用AI技术来优化这一过程。AI剪…

来源:AI每日精选摘要  硅星人Pro

半导体行业的“良率之殇”


在后摩尔时代,半导体行业面临良率管理的严峻挑战。随着芯片复杂度和晶体管密度的增加,良率管理难度呈指数级增长,特别是对追求先进制程的晶圆厂来说,良率问题可能成为致命伤。良率是半导体工厂的核心竞争力,直接影响成本和产能利用率,也是评估企业竞争力的重要标志。
在逻辑芯片领域,3纳米工艺是目前最先进的量产工艺,台积电和三星是主要竞争者。三星虽然率先宣布3nm量产,但在良率上遭遇挑战,导致客户流失。预计今年,包括智能手机、服务器、人工智能等在内的Fabless公司及IT大厂都将开始将3nm作为主要制程。台积电由于良率领先优势,预计将获得大部分大厂的3nm订单,进一步拉大与三星的市占率差距。然而,即使…

来源:AI每日精选摘要  半导体行业观察

AI+销售赛道产品盘点:AI 线索挖掘员将最快落地


在当前商业环境中,B2B企业增长的核心在于精准有效地触达潜在客户。随着人工智能(AI)技术的不断进步,AI+销售模式逐渐成为改变销售SaaS格局的关键力量。特别是AI+SDR(销售发展代表)赛道,因其工作复杂度和技能需求与AI模型能力高度契合,展现出巨大的发展潜力。
近期,几款AI SDR产品表现抢眼,如x11.ai和Clay,它们通过自动化和智能化手段,显著提升了销售效率和效果。x11.ai成立仅6个月就实现了200万美元的ARR,并以每月50%的速度增长。其AI员工Alice能够自动搜集客户名单,通过电子邮件和LinkedIn消息进行潜在客户挖掘,实现个性化触达。Clay则以5亿美元的…

来源:AI每日精选摘要  Founder Park

◈ 07月24日 星期三 【 9 篇 】

Notion突破1亿用户!Ivan Zhao回顾创业历程,「只要创始人还没放弃」


Notion,一款多功能的笔记和协作工具,其用户数已突破1亿大关。这一里程碑标志着Notion在创业11年的历程中,经历了从濒临破产到重塑产品,再到成为全球范围内备受模仿的创新典范的华丽转变。Notion的成功是产品驱动增长(PLG)和社区增长模式(CLG)的典范,创造了价值数亿美元的创作者经济。
Notion的创始人Ivan Zhao在回顾创业历程时,提到了三个关键的设计策略,这些策略对Notion的成功至关重要。首先,Notion团队意识到要让产品成为大众化的工具,必须从用户有一定认知的地方做起,因此他们决定推翻原有设计,从头再来。其次,Notion团队采用了一种独特的设计流程,通过团…

来源:AI每日精选摘要  Founder Park

东风岚图 AI 技术人才培养三步走:认知构建、技术提升、场景实战 | 极客时间企业版


东风岚图汽车在智能化领域的探索不仅体现在产品技术创新上,更显著于其人才培养战略。公司通过“扶摇行动”计划,与极客时间企业版合作,开展“AI 大模型实战训练营”,为超过30名员工提供了系统性的大模型训练、微调和部署方法培训。这种结合实战与理论的培训方式有效提升了员工的创新思维和跨界融合能力。
随着制造业的深刻变革,汽车制造业作为智能制造的领先行业,正不断深化与人工智能的结合,推动产业转型升级。东风岚图汽车在智能化领域取得显著成果,如其最新研发的岚海动力系统、智能座舱技术和5C超级快充技术,展现了公司掌握关键核心技术的决心。
在数字化人才培养方面,岚图汽车已建立起实用的OA系统,所有营销系统…

来源:AI每日精选摘要  AI前线

Llama成大模型顶流,扎克伯格掀论战:玩开源,时代变了


Meta Llama 3.1 405B的发布标志着开源大语言模型在功能和性能方面开始超越封闭模型,预示着开源AI的新时代。Meta创始人扎克伯格在长文中强调了开源对开发者、Meta以及全球技术发展的重要性。他指出,开源AI是AI积极发展的必要条件,能够促进创新、数据保护和成本效益。Llama模型的开源特性使其成为微调和蒸馏小型模型的理想选择,有助于建立完整的生态系统,推动技术进步。
Meta通过发布Llama 3.1 405B、70B和8B模型,与亚马逊、Databricks和英伟达等公司合作,拓展了更广泛的生态系统。这些模型将在AWS、Azure、Google、Oracle等主要云平台上…

来源:AI每日精选摘要  机器之心

Meta、Google 争相示好,雷朋眼镜为什么成了香饽饽?


Meta公司计划投资数十亿美元收购欧洲眼镜巨头EssilorLuxottica约5%的股份。EssilorLuxottica是全球最大的镜片制造商Essilor与全球最大的眼镜制造商Luxottica于2017年合并而成。合并后的EssilorLuxottica旗下拥有雷朋等知名品牌,在全球拥有广泛的销售网络。
Meta与雷朋合作开发了两代智能眼镜Ray-Ban Stories和Ray-Ban Meta。其中Ray-Ban Meta凭借其轻便舒适的佩戴体验、成熟的外观设计以及高通骁龙AR1芯片和Meta的Llama 3 AI模型的加持,取得了100多万台的亮眼销量。这表明在AI大模型等最新…

来源:AI每日精选摘要  极客公园

并购欧洲EDA公司,概伦电子引领国产EDA产业升级


近年来,中国EDA(电子设计自动化)产业在国产替代趋势的推动下迅速发展,涌现出一批本土EDA企业。随着客户需求的升级,本土EDA企业开始通过并购整合来提升产品性能、效率和可靠性,以满足市场需求。概伦电子作为国内首家上市的EDA公司,通过多次并购和股权投资,成功拓展了EDA工具链,构建了具有竞争力的产品矩阵,覆盖设计类、制造类、测试系统和一站式工程开发等多个领域。概伦电子近五年的营业收入复合增长率接近50%,显示出强劲的增长势头。
2023年8月,概伦电子完成了对比利时EDA公司Magwel的收购,进一步增强了其产品线和技术实力。Magwel在半导体物理验证领域拥有超过20年的经验,其核心优…

来源:AI每日精选摘要  半导体行业观察

2024拯救者杯OPENAIGC开发者大赛决赛入围名单公布


2024拯救者杯OPENAIGC开发者大赛是一项旨在展示AI驱动的数字技术创新价值和行业发展可能性的AI创新赛事。经过初赛的激烈竞争,共有146个开发成果从457支参赛团队中脱颖而出,成功晋级决赛。决赛入围团队分为企业组和高校组,企业组有75支团队,高校组有71支团队。
在企业组中,晋级的团队涵盖了产品组赛道和解决方案&企业应用赛道。部分晋级作品包括物圆TreLoop、AIGC课程内容生产与服务平台、smartPlanter智能花盆、SpeakGuru、广目多闻等,这些作品展示了AI在不同领域的应用潜力。企业组的参赛作品不仅包括智能产品,还涉及解决方案和企业应用,如AI赋能的法律服务、知识…

来源:AI每日精选摘要  AIGC开放社区

Lllama 3 诞生,开源模型首次击败当今最强闭源模型。开源万岁!


Meta公司发布了新一代开源大型语言模型(LLM)——Llama 3.1系列,包括8B、70B和405B三个尺寸的模型。其中,405B模型包含4050亿个参数,是首个前沿级别的开源AI模型,也是近年来规模最大的LLM之一。Llama 3.1系列模型在通用常识、可引导性、数学、工具使用和多语言翻译等广泛任务中表现出色,能够与GPT-4、Claude 3.5 Sonnet等领先闭源模型相媲美。
Llama 3.1系列模型的主要亮点包括:
1. 模型架构:延续Llama 3的标准解码器transformer架构,以最大化训练稳定性。
2. 巨量数据:405B模型在15万亿token(相当于750…

来源:AI每日精选摘要  硅星人Pro

PixVerse V2 登场!一口气生成5个“Sora”,视频生成赛道“卷”飞了


PixVerse V2是爱诗科技推出的一款基于DiT(Diffusion + Transformer)架构的视频生成产品,它在模型能力和产品化效果上都有显著提升。PixVerse V2能够单次生成8秒的视频,并且支持一键生成1-5段连续的视频内容,片段之间会自动保持主体形象、画面风格和场景元素的一致性。这使得用户可以轻松生成40秒的视频内容,同时提升了视频的动态幅度、细节表现力和真实性。
PixVerse V2的产品设计注重用户体验,将复杂的功能简化,让普通用户也能进行创作。它在处理复杂场景和长视频序列时表现出色,连贯性不仅限于视觉上的一致,更包括了动作和情节上的流畅过渡。此外,PixVe…

来源:AI每日精选摘要  硅星人Pro

晶圆代工巨头,新竞赛


台积电在最近举行的法说会上提出了“晶圆代工2.0”的新概念,这一概念不仅包括传统的晶圆制造,还涵盖了封装、测试、光罩制作等环节,但不涉及存储芯片的IDM。台积电认为,新定义能更充分反映不断扩展的未来市场机会,预计2024年晶圆制造产业同比增长近10%。与此同时,英特尔在2021年提出了IDM 2.0战略,旨在成为领先的半导体代工厂,并计划在四年内交付五个新工艺节点,投资1000亿美元扩展产能。
台积电的财务长黄仁昭表示,重新定义晶圆代工的原因是为了应对国际IDM厂商进入代工市场,以及扩大台积电在先进封装领域的影响力。台积电将继续专注于最先进后段技术,帮助客户打造前瞻性产品。在AI和HPC领…

来源:AI每日精选摘要  半导体行业观察

◈ 07月23日 星期二 【 7 篇 】

几何朗兰兹猜想被解决!历时30年、证明论文达800余页,中国学者陈麟系主要作者


几何朗兰兹猜想,作为朗兰兹纲领的几何化版本,经过30余年的研究和9位数学家的共同努力,终于得到了证明。朗兰兹纲领自1967年由罗伯特·朗兰兹提出,旨在揭示数论、代数几何和群表示论三个数学分支之间的深刻联系。这一理论框架不仅对数学领域产生了深远影响,也为物理学中的量子场论和弦理论提供了重要的理论支持。
几何朗兰兹猜想的提出,为数学家们提供了一种将数论方法和概念应用于几何问题的新途径。这一猜想的证明,无疑将为数学和物理学领域中的诸多难题提供新的解决思路和工具。菲尔兹奖得主彼得·舒尔茨和几何朗兰兹纲领创始人之一亚历山大·贝林森都对这一成果给予了高度评价。
这一重要成果的研究团队由哈佛大学教授丹…

来源:AI每日精选摘要  量子位

极群科技陈春宇:会有新产品取代微信,这是注定的规律


极群科技创始人陈春宇认为,在人工智能(AI)时代,解决问题比炫耀技术更为重要。他指出,许多产品问题并不需要使用最先进的模型来解决,而是应该专注于解决用户的实际问题。陈春宇本人的成长经历和创业历程也体现了这一理念。他从小在江西上饶一个普通家庭长大,父母开明,鼓励他自主探索世界。他从未参加过中高考,通过竞赛保送进入清华大学。
2017年,陈春宇通过邮件申请在清华实验室工作,期间发表了两篇论文。2020年,受丁香园疫情报告启发,他制作了疫情动态地图,被多家媒体报道,相关数据被30余家科研机构使用。这让他意识到,只要产品有价值,就会有很多人愿意提供帮助。
2021年,在源码资本实习期间,陈春宇参…

来源:AI每日精选摘要  AI科技评论

别光看流量,小红书电商的最大价值其实是「人」


随着电商行业的发展,个性化成为了新的关键词。小红书作为一个快速成长的社区平台,有机会在电商领域释放更大价值。小红书电商的目标是构建属于自己的原生商业体系,通过社区价值重新被看见,实现个性化需求的规模化激发。
在传统电商平台的竞争中,“多、快、好、省”是核心价值点,但随着供给过剩和竞争趋同,需求侧的拉动力变得尤为重要。个性化需求的满足成为了电商的新挑战,而小红书通过社区的形式,让用户在平台上找到同温层,满足个性化需求。小红书的电商生态中,出现了很多满足用户个性化需求的商家和商品,如长尾搜索词的占比已经超过60%,显示出用户需求的个性化。
小红书电商的核心在于“人”,而非“流量”。通过“人”…

来源:AI每日精选摘要  极客公园

谷歌AI天气「神算」登Nature:30秒模拟22天天气,效率暴涨10万倍!


谷歌公司提出了一种新型的基于机器学习(ML)的大气环流模型NeuralGCM,该模型在气候建模领域取得了重大突破。NeuralGCM结合了传统的物理建模和人工智能技术,相较于传统模型,它在模拟大气方面的效率提高了10万倍,计算成本降低了10万倍,相当于高性能计算领域25年的进步速度。此外,NeuralGCM在2-15天的天气预报方面,比现有的最先进的物理模型还要准确。
NeuralGCM的开发团队主要由Google Research和DeepMind的研究人员组成,还包括来自麻省理工学院、哈佛大学和欧洲中期天气预报中心(ECMWF)的科学家。研究成果已发表在《自然》杂志上。NeuralGC…

来源:AI每日精选摘要  新智元

Llama 3.1 源模型泄露背后:失手的 GitHub,破碎的 Meta,好在最小参数都能打脸GPT-4o!


7月23日凌晨,Meta的新版大型语言模型(LLM)Llama 3.1 405B在4chan上泄露,并在多数基准测试中击败了GPT-4o。据悉,Meta可能很快正式发布Llama 3系列中最大的参数模型及70B版本。尽管泄露的Llama 3.1模型链接已失效,但网友保存的下载链接显示文件约763.84G。HugginFace上的链接也已被删除,但有网友猜测泄露可能来自第三方托管商。
Llama 3.1是在3.0版本基础上的功能迭代,70B模型在部分领域性能超过GPT-4o。有网友认为,如果评测数据真实,Meta的最顶级AI模型将免费开放,各国政府、组织和公司都能获得同等AI能力。但Llam…

来源:AI每日精选摘要  AI前线

对话实在智能&语核科技:Agentic Workflow如何加速企业自动化


在本次直播中,两位在人工智能领域的创业者,语核科技的创始人兼CEO翟星吉和实在智能的合伙人、产品创新部负责人周春照,深入探讨了AI如何利用Agent引领企业自动化和智能化的新浪潮。他们讨论了Agent Workflow在重塑企业业务流程、提升效率以及创造新的商业机会方面的作用。
翟星吉强调,AI的核心价值在于对企业业务的深入理解以及在边缘场景中实现准确率的可控性。他认为,大型AI模型将成为类似电力的基础设施,通过与企业的具体业务结合,实现价值的创造。企业需要的是能够解决其特定业务痛点的定制化AI应用,而不是通用的基础模型。在落地过程中,需要关注场景选择和产品的实际应用效果。他提出,当前行业…

来源:AI每日精选摘要  硅星人Pro

大模型的招投标订单都被谁拿走了?


随着大模型技术的快速发展,中国科技界迅速跟进,该技术在多个领域得到应用,提升了企业运营效率和消费者体验。然而,大模型企业在技术成熟度、成本、数据安全、行业差异和用户接受度等方面面临挑战,商业化问题依然存在。
尽管To C商业化前景尚不明确,大模型在招投标市场已初现规模。2023年全年,招投标市场发起了190次大模型采购需求,采购规模达5.95亿元。2024年上半年,招投标市场已经产生了498次大模型相关招标项目,招标金额超过13.4亿元,显示出市场的快速增长。
在地域分布上,采购需求主要集中在北京、广东、上海、江苏、浙江等地,贵州省则凭借东数西算大模型建设工程相关项目,成为采购金额最高的…

来源:AI每日精选摘要  硅星人Pro

◈ 07月22日 星期一 【 8 篇 】

从空间智能到具身智能,跨维践行Sim2Real AI最高效路径


随着具身智能的兴起,数据成为了AI发展的关键资源。然而,通用具身智能面临的主要挑战之一是数据的匮乏。Sim2Real AI技术被认为是实现具身智能的有效途径,通过物理仿真和合成数据来弥补真实数据的不足。香港中文大学(深圳)的贾奎教授认为,Sim2Real AI是实现具身智能的最高效路径。
贾奎教授指出,空间智能和具身智能是近年来受到广泛关注的领域。空间智能涉及个体在三维物理空间及四维时空中的认知和推理能力,而具身智能则要求智能系统具备物理形态,并通过这个形态与环境进行交互。具身智能的本质是学习并泛化技能空间,实现类似人类的通用人工智能。
在实现具身智能的过程中,贾奎教授强调了建立“世界模…

来源:AI每日精选摘要  机器之心

盛名一时的BERT哪去了?这个问题的答案昭示了LLM范式的转变


在大型语言模型(LLM)的发展历程中,我们见证了从编码器-解码器模型到仅解码器模型的转变。AI 创业公司 Reka 的首席科学家 Yi Tay 在其博客文章中深入探讨了这一变化及其背后的原因。
Yi Tay 首先介绍了 LLM 模型架构的三大范式:仅编码器模型(如 BERT)、编码器-解码器模型(如 T5)和仅解码器模型(如 GPT 系列)。他指出,编码器-解码器模型实际上也是自回归模型,解码器在这些模型中扮演着因果解码器的角色。此外,他还提到了前缀语言模型(PrefixLM),这是一种没有交叉注意力的变体,有时也被称为非因果解码器。
Yi Tay 强调,BERT 等仅编码器模型的去噪方…

来源:AI每日精选摘要  机器之心

5 年 160 亿估值,硅谷「企业 AI」领头羊怎么做到的?


Glean公司在企业AI搜索领域取得了显著成就,成功吸引了索尼电子、Databricks等行业巨头,并在D轮融资中获得了2亿美元的投资,公司估值达到22亿美元。Glean的核心产品是一个企业内部AI搜索平台,提供AI搜索、知识管理和工作主页等功能。与传统搜索相比,GIean的AI搜索具有跨应用和个性化的优势,能够快速搜索定位和整合零散信息,如会议记录、支持票据、项目档案等。
Glean的AI助手具备三个主要功能:1. AI答案:根据用户需求、偏好和访问权限提供定制化搜索结果;2. 专家检测:在检索不到信息时,将员工与能提供帮助的人联系起来;3. 上下文推荐:查看与选中内容相关的补充内容和上…

来源:AI每日精选摘要  极客公园

Claude Sonnet 3.5 口碑爆棚!10 倍速开发,“2 个月内用 Rust 从零构建完一款产品”


技术创始人lapurita分享了使用Claude Sonnet 3.5实现10倍开发速度的经验,引起了开发者的共鸣。lapurita介绍了他的工作流程,包括与Claude讨论功能、编写基本规格、提供上下文并请求代码实现。他强调了为Claude提供“main context”文件的重要性,该文件明确指定了应用程序的目标和技术决策。此外,他还提到了在Claude中创建多个对话以避免上下文混乱的技巧。
lapurita认为,了解应用程序的架构对于使用Claude至关重要。缺乏经验的开发者可能会使代码库变得混乱和复杂。他建议开发者始终引导Claude按照自己的意愿行事,并跟上和理解生成的代码。这种…

来源:AI每日精选摘要  AI前线

两次全球蓝屏,祸首竟是同一人?14年后,灭霸CEO再酿IT灾难


微软全球蓝屏事件的调查结果揭示了一个由CrowdStrike公司CEO George Kurtz引发的系统逻辑错误,该错误导致了全球约10亿台计算机的故障。这一事件与2010年McAfee的一次软件更新事故有着惊人的相似之处,当时Kurtz担任McAfee的首席技术官。两次事件都涉及到了软件更新导致的全球性IT灾难,且都需要人工干预来解决问题。
在2024年7月19日,CrowdStrike发布了一次针对Windows系统的传感器配置更新,该更新本意是为了应对网络攻击中常见的C2框架使用的恶意命名管道,但由于逻辑错误,却触发了系统的崩溃和蓝屏(BSOD)。CrowdStrike很快在官博上…

来源:AI每日精选摘要  新智元

小米造车,雷军逐梦,一个关于人的修炼场


本文讲述了小米公司创始人雷军如何将小米带入汽车制造行业,并在短时间内取得显著成绩的故事。文章首先回顾了保时捷品牌的发展历程,强调了保时捷对汽车行业的深远影响。随后,文章转向小米造车的过程,雷军在面对外界质疑和压力下,凭借坚定的信念和勇气,成功带领小米进入汽车市场。
文章提到,小米造车的想法源于2021年美国对小米的制裁,为了避免手机业务受影响,雷军决定进入汽车行业。尽管面临巨大风险和挑战,雷军凭借对梦想的执着追求,成功推动小米SU7的下线交付。文章还提到了小米汽车团队的核心成员,如胡峥楠等人的贡献。
在演讲中,雷军多次强调了“梦想”的重要性,鼓励大家不要放弃追逐梦想。小米SU7的成功,不…

来源:AI每日精选摘要  硅星人Pro

从短剧到 AI 大模型,新兴行业如何让组织「跟上」业务?


在科技商业世界中,组织与效率是常谈常新的话题。近年来,许多企业通过重塑生产力和生产流程,实现了跨越专业背景和经验履历的鸿沟,创造出真正有价值的事物。其中,飞书作为一款生产力工具,被广泛应用于新兴行业的组织人才与业务中。
短剧行业是新兴行业中的一个典型例子。短剧行业竞争激烈,市场需求快速变化,制作周期短,对制作效率有极高要求。丰行文化等短剧制作公司通过使用飞书,实现了高效协作,提高了制作效率。导演可以通过飞书云文档评论批注剧本,录制剧本围读会议,留存关键信息,并通过多维表格管理项目前期工作和后期剪辑进度。
除了短剧行业,大模型及其衍生的AI应用也是新兴行业之一。智元机器人等公司通过使用飞书…

来源:AI每日精选摘要  极客公园

硅谷新公司SF Compute:AI算力的”Airbnb”,奥特曼亲弟领投,估值5亿


旧金山初创公司San Francisco Compute(SF Compute)以其创新的AI算力租赁服务在AI领域引起关注。该公司通过提供短期、灵活且经济实惠的超级计算资源访问,帮助早期AI公司更高效地开发和训练AI模型。SF Compute的服务模式类似于住宿领域的Airbnb,通过共享和按需租赁,让用户以较低成本获取所需资源。
SF Compute的算力租赁服务提供按周、按天甚至按小时计费的短期租赁选项,用户可以根据实际需求动态调整计算资源使用量。与传统长期合同相比,SF Compute的租赁价格更具竞争力。例如,租赁512个H100 GPU两周的费用仅为50万美元,远低于其他提供商…

来源:AI每日精选摘要  硅星人Pro

◈ 07月21日 星期日 【 10 篇 】

从 OpenAI 收购实时分析数据公司看未来数据库长什么样?


OpenAI收购实时分析数据库Rockset的事件在数据库领域和AI界引起了广泛关注。Rockset成立于2016年,由来自Facebook、谷歌、雅虎、甲骨文和VMware等公司的技术专家组成,其中联合创始人&CTO Dhruba Borthakur是RocksDB的创始工程师,也是Hadoop和Apache HBase的贡献者。OpenAI此举意在强化实时数据访问和处理能力,以在AI竞赛中取得优势。
PingCAP的联合创始人黄东旭和副总裁刘松在接受采访时,分享了AIGC时代下数据库的发展趋势和TiDB的探索。他们指出,AI技术的发展对数据库提出了新挑战,如大模型和Chatbot等AI…

来源:AI每日精选摘要  AI前线

斯坦福博士图解AlphaFold 3:超多细节+可视化还原ML工程师眼中的AF3


AlphaFold 3是由谷歌DeepMind开发的人工智能模型,它在生物学和制药领域产生了重大影响,具有潜在的数千亿美元商业价值。AlphaFold 3的工作原理复杂,斯坦福大学的两位博士生Elana Simon和Jake Silberg通过图解方式对其进行了详细的解释,使得机器学习工程师能够更容易理解其技术实现。
AlphaFold 3的架构主要包括输入准备、表征学习和结构预测三部分。输入准备阶段,模型将蛋白质序列和其他分子转换成六个张量,包括token级单一表征、token级配对表征、原子级单一表征、原子级配对表征、MSA表征和模板表征。这一阶段包括tokenization、检索、创…

来源:AI每日精选摘要  新智元

在机器人顶会 RSS 2024 上,中国的人形机器人研究斩获最佳论文奖


2024年机器人领域重要会议RSS(Robotics: Science and Systems)在荷兰代尔夫特理工大学成功举行,吸引了近900名专业人士参与。会议最后一天,颁发了最佳论文、最佳学生论文、最佳系统论文和最佳Demo论文等多个奖项。其中,清华大学和北京星动纪元科技有限公司的人形机器人研究荣获最佳论文奖,而Ji Zhang获得了时间检验奖。
最佳Demo论文奖颁给了《Demonstrating CropFollow++: Robust Under-Canopy Navigation with Keypoints》,该论文提出了一种基于经验的鲁棒性视觉导航系统,用于作物冠下农业机器…

来源:AI每日精选摘要  机器之心

打破生态孤岛,国产异构原生AI算力工具问世,来自中科加禾


中科加禾公司于7月20日发布了其第一代异构原生AI算力工具,旨在解决算力瓶颈问题,并推动国内技术生态的发展。该工具通过系统优化,实现了不同种类芯片的大规模并行运行,提高了效率,同时为用户提供了统一的高性能接口,简化了不同芯片生态的使用。中国工程院院士孙凝晖在发布会上强调了系统软件优化在智能生态进步中的重要性。
中科加禾的AI算力工具已经在国产AI基础设施上发挥作用,支持340B参数量的稠密大模型和640B的MoE大模型,显著降低了时延,提升了吞吐率和能效比。公司已与多家芯片、集成商、服务商等客户合作,支持国内外主流大模型,并实现多样化并行推理。
公司提出的“三零一高”目标,即在不同芯片上…

来源:AI每日精选摘要  机器之心

OpenAI掀小模型血战!苹果DCLM强势登场,碾压Mistral 7B全开源


近期,人工智能领域出现了小模型的热潮。OpenAI推出了GPT-4o mini,Mistral AI与英伟达合作发布了Mistral NeMo,而苹果公司也加入了这一竞争,发布了包含70亿和14亿参数的DCLM小模型,并立即开源。这些小模型的发布,不仅在性能上有所突破,更在开源方面树立了新的标杆。
苹果的DCLM小模型在性能上接近Llama 3和Gemma,且在HuggingFace上已经发布了全部模型权重。DCLM-7B模型采用了decoder-only架构,使用PyTorch和OpenLM框架进行预训练。在上下文长度为2048的情况下,DCLM在53个基准任务上的评估表现优异,尤其在核…

来源:AI每日精选摘要  新智元

三星芯片帝国,渡劫!


1993年,三星董事长李健熙在德国法兰克福提出“新经营”宣言,强调变革的重要性。尽管当时三星在DRAM市场位居首位,但其他部门表现平平。李健熙的强硬手腕和远见使三星在90年代成为全球知名企业。然而,30多年后的今天,三星面临诸多挑战。
三星电子的销售额增长缓慢,2012年至2023年间年均增长率仅为2.3%。移动部门销售额大幅下降,从2013年的苹果销售额的73%降至2023年的22%。半导体部门也面临困境,非存储部门销售额从2011年的台积电88%降至2023年的26%。三星在高带宽内存(HBM)生产上遇到难题,未能满足AI半导体的需求。
三星半导体部门进行了业务重组,试图缩短与竞争对…

来源:AI每日精选摘要  半导体行业观察

仅微调0.02%参数,性能接近全量微调!上交大推出高效微调统一新范式


随着大模型应用的扩展,基础模型的参数数量不断增加,给训练带来了巨大负担。为了解决这一问题,研究者们开始关注高效微调(Parameter Efficient Fine-Tuning, PEFT)算法,如Adapter、Prompt-Tuning以及LoRA等。然而,尽管PEFT方法发展迅速,其背后的数学基础和不同方法之间的性能差异尚未得到深入研究。
上海交通大学的研究者们对各种PEFT方法进行了全面数学分析,并提出了一种新的框架——子空间微调。这一框架旨在将所有已知的PEFT方法统一在一个理论下,主要集中于调整原始参数的子空间,涉及子空间的重构和扩展。研究者深入探讨了不同方法如何操作子空间,…

来源:AI每日精选摘要  量子位

开源独角兽 GitLab 走上“卖身”路!前工程师拆台:赚钱的业务不好好运营,开发了一堆没用的功能


美国云计算软件开发工具提供商GitLab正在考虑出售,吸引了包括云监控公司Datadog在内的潜在竞标者的兴趣。GitLab目前与投资银行家合作启动出售流程,但交易尚需数周时间,协议也不确定。GitLab股价在出售消息传出后飙升逾14%,而Datadog股价下跌超3%。
GitLab总部位于美国旧金山,拥有约2130名全球员工,全部远程办公。公司为企业提供管理软件开发周期的工具,拥有3000多万注册用户,其中《财富》百强企业中有一半以上使用该平台。GitLab于2021年在纳斯达克上市,股票代码为”GTLB”,首日市值接近150亿美元,但目前股价已不到上市时的一半。
GitLab的投资者…

来源:AI每日精选摘要  AI前线

专访诺奖得主:大模型是记忆还是理解?


托马斯·萨金特教授,2011年诺贝尔经济学奖得主,在接受机器之心专访时,分享了他对人工智能(AI)和机器学习(ML)的看法。萨金特教授认为,AI和ML的核心理念可以追溯至伽利略时代,它们通过构建世界模型来进行预测和决策。他指出,AI旨在完成过去由伽利略、达尔文和开普勒等先驱完成的智能任务,而ML技术利用数据、概率论和微积分来推断模式。
萨金特教授在他的工作论文《Sources of Artificial Intelligence》中提到,程序员设计ML芯片、算法和代码,实际上是在再现伽利略的自由落体实验。他认为,尽管当前的大模型在某些人看来可能只是进行“记忆”和统计分析,但它们实际上在寻找…

来源:AI每日精选摘要  机器之心

微软蓝屏全球停摆,这个锅是ta的?一次更新酿成全球灾难


近日,全球多地因一次安全软件更新而遭受大规模IT故障,导致航班停飞、银行系统瘫痪,甚至影响到医疗机构、支付系统等基础设施的正常运行。这场由网络安全公司CrowdStrike引发的故障波及全球,被认为是史上规模最大的IT故障之一。
据报道,此次故障源于CrowdStrike的一款名为Falcon的安全工具。该工具通过识别异常行为和漏洞,保护计算机系统免受恶意软件等威胁。然而,周五的一次更新却导致全球范围内使用CrowdStrike软件的设备出现故障,包括杂货店的收银机、机场和火车站的出发信息板、学校的计算机、工作用的笔记本电脑和台式电脑、机场的值机系统、航空公司的票务和调度平台、医疗网络等。…

来源:AI每日精选摘要  新智元

© 版权声明
讯飞星火大模型

相关文章

没有相关内容!
星火内容运营大师

5 条评论

  • 硅星人Pro
    硅星人Pro 投稿者

    这个主题很棒,赞

    回复
  • AI前线
    AI前线 投稿者

    收藏啦收藏啦

    回复
  • admin

    有啥改进意见,欢迎提出

    回复
  • Founder Park
    Founder Park 投稿者

    精选内容有重复的😅

    回复
  • 新智元
    新智元 投稿者

    精选内容很好,方便查看

    回复