❤️ 实时更新精心挑选的评分较高的最新文章摘要(每日最多10篇),助你随时了解人工智能领域的最新动态和热门事件 ❤️
◈ 09月07日 星期六 【 9 篇 】
◎ 不仅仅是「GPTs」,支付宝在做一种很新的智能体
在9月5日的外滩大会上,蚂蚁集团的顾进杰宣布了支付宝启动智能体生态共建计划,并推出了智能体开发平台「百宝箱」。这一举措标志着支付宝在智能体领域的进一步发展,将智能体与商业紧密结合,推动了AI服务的互联网化。
智能体(AI Agent)在AI2.0时代被视为前沿应用,但今年在国内迅速走红,腾讯、字节等大公司纷纷推出相关产品。支付宝的智能体不仅关注技术提升,更注重商业模式的闭环,通过0代码、快速创建专属服务智能体,实现与支付宝小程序、App等平台的一键发布。
支付宝的智能体采取了「自下而上」的生态建设模式,基于丰富的服务生态和行业Knowhow,从需求方出发构建专业智能体。智能体的优势在于高…
来源: AI科技评论
◎ 加入 AI 混战,蚂蚁全面加速「卷应用」
在2024年的Inclusion·外滩大会上,蚂蚁集团展示了其在人工智能领域的最新进展,特别是其AI管家系列的应用。这些应用旨在通过AI技术改善人们的日常生活,涵盖了生活管理、金融服务和健康护理等多个方面。
首先,蚂蚁推出了AI生活管家“支小宝”,这是一个独立的应用程序,也内嵌在支付宝中,能够通过自然语言交互帮助用户完成各种日常任务,如打开地铁乘车码、点餐、查询快递等。支小宝的特色在于其对话即交付的能力,它能够理解用户的意图并调用相应的系统或智能体来完成任务。此外,支小宝还具备场景感知系统,能够根据用户的习惯和场景智能推荐服务。
在金融服务领域,蚂蚁推出了AI金融管家“蚂小财”,它连接了…
来源: 极客公园
◎ 创业2年肝出爆款AI 工具!碾压VS Code、让OpenAI 员工都倒戈,开发者们集体上头!
Cursor AI 编码工具是由 Anysphere 公司开发的一款集成了 Claude 3.5 Sonnet 和 GPT-4o 等先进模型的编程辅助工具,它通过提供高效的编程体验,使用户能够仅通过文本提示编写、预测和操作代码。这款工具不仅简化了编程过程,降低了编码的门槛,还因其与 Microsoft Visual Studio Code 的兼容性和用户体验而受到广泛欢迎,吸引了包括新手程序员和资深工程师在内的用户群体。
Anysphere 公司成立于 2022 年,由 Michael Truell 和其他三位联合创始人在麻省理工学院结识后成立,他们共同的目标是创建一个集成开发环境(IDE…
来源: AI前线
◎ 拒绝“零和”游戏!腾讯新一代混元 Turbo 降价 50%,RAG 方案支持快速定制 AI 应用
在2024年腾讯全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生提出,面对内外部挑战,企业增长的关键在于探索产业新发展,具体可通过三个方向实现:以数提效、抓住新产业机会、开拓全球市场。
首先,以数提效意味着利用人工智能技术优化现有业务场景,提高经营效率。汤道生指出,对于大多数企业而言,短期内期待大模型带来巨大变化并不现实,而应关注于通过AI降本增效。
其次,抓住新产业机会,特别是软件领域。汤道生强调软件定义硬件发展方向的重要性,认为软件能够使硬件设备释放更大价值。
第三,开拓全球市场是企业增长的另一机遇。调研显示,90%的中国企业对海外业务拓展感兴趣,腾讯云提…
来源: AI前线
◎ 重磅!TIME揭榜2024全球AI 100人:奥特曼、黄仁勋、姚期智、王小川等上榜
TIME杂志最近公布了第二届100位最具影响力的人工智能人物名单,这些人物在AI领域内具有举足轻重的地位。榜单中包括了领导者、创新者、思想者和塑造者等不同角色,他们分别在各自的领域内推动着人工智能的发展。
在领导者类别中,谷歌和Alphabet的CEO Sundar Pichai,以其在谷歌工具栏和Chrome开发中的领导作用,以及对Android操作系统的推出贡献而闻名。微软CEO Satya Nadella,以其在Windows NT开发和微软重大收购案中的工作而受到认可。OpenAI的CEO Sam Altman,通过推出GPT-4o、视频生成器Sora和AI搜索引擎SearchGP…
来源: 新智元
◎ 外滩大会上,我们看到了人工智能五年后的样子
2022年底,ChatGPT的发布引发了科技界的广泛关注,用户注册量迅速增长,科技巨头纷纷加入生成式AI的竞争。然而,到了2024年,尽管讨论热烈,人工智能在日常生活中的应用并未显著改变,大模型如GPT 5.0的延迟发布引发了对Scaling Law曲线放缓的担忧,以及对Transformer架构潜力的质疑。尽管存在问题,乐观者认为这是技术融入日常生活的必经缓冲期。
技术发展需要时间,基础设施、应用层面的落地以及法律、道德和伦理的准备都是必要的。外滩大会上,AI的未来趋势成为讨论焦点,包括其在疏解孤独和缓解全球变暖方面的潜力。AI的发展不仅仅是技术问题,还涉及到社会和伦理层面的挑战。
在…
来源: 机器之心
◎ GPT-4o不会数r,被外国小哥原地逼疯! 谷歌论文揭秘Transformer「数不到n」
在新智元的报道中,工程师Riley Goodside通过“Strawberry里有几个r”的问题测试了多个大型语言模型(LLM)的能力。他发现,尽管一些模型声称能够解决这一问题,但实际上它们的表现并不理想。例如,Reflection 70B模型在“反思微调”算法的帮助下能够纠正错误,但GPT-4o模型在多次尝试后仍然无法给出正确答案,甚至在被连续判错后出现了混乱的回答模式。
Riley Goodside的测试显示,GPT-4o在36次回答中,错误地回答“2个”的次数最多,尽管这明显是错误的。相比之下,Claude 3.5 Sonnet模型在面对错误判断时会追问原因,并在发现提问者持续不合理…
来源: 新智元
◎ 太火了!我在外滩大会玩Deepfake,想骗过机器人结果……
在外滩大会上,Deepfake技术的攻防成为了焦点,吸引了大量观众和2200多名技术研究者的关注。Deepfake技术因其在犯罪活动中的潜在应用而引起公众担忧,被称为“韩国N号房再现”。在这次大会上,中科院自动化所宣布将开源AI模型以对抗Deepfake威胁。
蚂蚁数科的展区展示了Deepfake技术的生成与对抗过程。参观者只需站在定点,由iPad拍摄人脸,AI模型即可生成换脸图像或视频。现场的机械臂使用智能手机摄像头收集数据,并在短时间内识别出真实照片。这一过程由天玑实验室和安全品牌ZOLOZ提供技术支持。天玑实验室专注于可信数字身份,而ZOLOZ则为多个国家和地区提供技术服务,包括身份…
来源: 量子位
◎ AI芯片,新变化
随着人工智能技术的发展,对计算资源的需求不断增加,特别是在处理大型语言模型时。为了应对这一挑战,人工智能系统设计正在经历转变,从追求速度最快的处理器转向更加平衡的方法,这种方法包括高度专业化的异构计算元素、更快的数据移动和显著降低的功率消耗。
芯片制造商正在采用2.5D/3.5D封装技术,以实现更大的定制化和提高每瓦性能。在Hot Chips 24会议上,领先的芯片制造商展示了新的微架构、预取和分支预测的改进、更快的内存访问以及更智能的片上和片外数据管理。这些新设计旨在减少处理大型语言模型所需的能源,同时在超大规模和边缘数据中心挖掘新机遇。
NVIDIA的新款Blackwell芯片结合了…
来源: 半导体行业观察
◈ 09月06日 星期五 【 10 篇 】
◎ Andrej Karpathy最新激进观点:Transformer将超越人脑
Andrej Karpathy,前OpenAI成员及特斯拉自动驾驶计算机视觉团队领导者,近期在播客节目No Priors中分享了他对AI未来的激进观点。Karpathy认为,Transformer模型在性能上有望超越人类大脑,并且在特定领域我们已经实现了有限的人工通用智能(AGI)。他预测,AI将成为人类新的大脑皮层,极大地增强人类的生产力和效率。
在自动驾驶领域,Karpathy将AGI与自动驾驶技术相提并论,认为在旧金山等城市已经出现了可付费使用的自动驾驶汽车服务,这标志着AGI在该领域的实现。他比较了Waymo和特斯拉的自动驾驶技术,认为尽管Waymo在技术上看似领先,但特斯拉在软件…
来源: 机器之心
◎ 4800个大模型团队竞逐「产业真题」,这场金融科技大赛火出圈了
《全球数字经济白皮书 (2024)》的统计数据显示,全球已有超过1300个基础大模型,其中美国和中国是这一领域的领头羊。中国在大模型技术方面已达到全球第一梯队,产业场景丰富,落地空间广阔,预计在应用层面将展现出更强的潜力。目前,业界面临的挑战是如何将大模型技术与真实产业场景有效结合。
AFAC2024金融智能创新大赛作为国内大模型人才的竞技场,以金融行业内的真实案例和数据为依托,鼓励参赛者探索创新模型和算法。大赛在原有赛制基础上进行了升级,新增了初创组和企业组,形成了综合赛制架构。蚂蚁集团副总裁王晓航强调,大赛旨在集聚和培养科技人才,开展高水平合作交流,并为选手提供了技术支持和丰厚奖金。
…
来源: 机器之心
◎ 去 Discord 做社交游戏吧,这是 a16z 的 AI 创业建议
游戏行业正经历着由人工智能(AI)技术推动的变革,AI的加入为游戏设计和玩法带来了新的可能。A16z合伙人Joshua Lu对此表示兴奋,并鼓励初创公司在Discord上构建游戏。Discord作为一个拥有2亿月活跃用户的平台,以其跨平台特性和稳定的语音视频分享服务,成为游戏爱好者的理想选择。Discord团队也在秘密推进一个新计划,旨在让开发者能在平台上直接发布游戏和消费应用,这可能使Discord成为最大的游戏平台之一。
网页游戏在过去几十年经历了兴衰,但随着移动游戏的兴起,亚洲市场出现了如微信、Line和Kakao等超级应用分发平台。尽管西方的HTML5游戏平台如Facebook I…
来源: Founder Park
◎ 谁家大模型,敢 1 个月收 2000 美元啊?!
OpenAI正在考虑为其下一代AI模型推出高价订阅服务,可能包括即将推出的Strawberry推理模型和GPT-4o的继任者Orion。据The Information报道,OpenAI高管考虑向用户收取高达2000美元的费用,以使用其最先进的AI模型,而目前的ChatGPT Premium每月收费20美元。OpenAI定义了人工智能创新的五个阶段,其中第二阶段是能够像人类一样解决问题的“推理者”,Strawberry模型正在开发中,能够通过多步骤推理问题,预计最早今年秋季发布。同时,OpenAI还在开发代号为Orion的新的大型语言模型,Strawberry被用于为Orion生成高质量的训…
来源: AI前线
◎ “支小宝”团队回应一切:为什么我们要在支付宝App之外做一款AI生活助理独立应用?|钛媒体AGI
2024年9月5日,蚂蚁集团在Inclusion·外滩大会上发布了支付宝的AI生活管家App“支小宝”,该应用已在苹果和安卓应用商店上线。据七麦数据,自8月28日上架苹果App Store以来,“支小宝”在生活类应用中排名第24。这款基于蚂蚁百灵大模型的应用,能够连接支付宝生态,通过对话快速完成订票、点餐、打车等日常任务,并提供基于“百宝箱”平台开发的AI智能体,以及场景感知系统和智能推荐服务。
“支小宝”的界面分为“此刻”、“对话”和“智能体”三个功能页面。其中,“对话”功能通过聊天解答用户问题并推送服务卡片;“此刻”功能根据用户习惯和场景推荐服务;“智能体”则针对专业问题提供解决方案。…
来源: 钛媒体AGI
◎ 支付宝突然推出新App,竟想用AI让日常生活开挂
支付宝推出了一款名为“支小宝”的AI原生应用,旨在通过人工智能技术简化用户的日常任务和提高生活质量。这款应用的核心功能包括主动陪伴和跑腿办事,用户可以通过简单的语音指令完成如叫车、订票、充话费等服务。支小宝的界面设计简洁,以蓝色为主色调,提供“此刻”和“对话”两个主要功能,分别对应主动陪伴和执行任务。
支小宝的智能体能够理解用户的自然语言需求,并将其转化为具体的操作指令,实现一键完成复杂任务。例如,用户只需说出需求,支小宝就能自动填写信息并完成购票、挂号等操作。此外,支小宝还具备场景感知系统,能够根据用户的日常习惯和位置提供个性化服务,如自动更新天气、新闻和待办事项。
支付宝在技术层面进…
来源: 机器之心
◎ 离线图生图、自动旋转屏,联想刚发了新一代 AIPC
在新一代人工智能个人电脑(AIPC)的发展浪潮中,联想公司在IFA展览会上展示了其在AIPC领域的最新成果。联想不仅更新了Yoga、ThinkPad和ThinkBook等产品线,还通过集成AI功能,重新定义了这些产品的特性。
联想与Stability AI合作,推出了基于Stable Diffusion 3.0模型的端侧图片生成工具Creator Zone。这款应用程序允许用户通过文本描述或草图生成图像,并且支持图生图模式,用户可以输入参考图片来创建风格多样的图像内容。Creator Zone还内置了高级图像编辑功能,且在联想AI PC上的所有图像生成功能都是免费提供的。
在AIPC的改…
来源: 极客公园
◎ “算力版滴滴”发布AI云新品,PPIO董事长预测未来三年模型推理成本将下降1000倍|钛媒体AGI
中国正经历一场由AI大模型和相关技术推动的算力基础设施建设热潮。根据国家统计局数据,截至5月底,中国已规划10余个智算中心,智能算力占比超过30%,算力机架总规模超过195万架,上架率约63%。国家数据局党组书记、局长刘烈宏在2024中国国际大数据产业博览会上透露,中国八大国家枢纽节点直接投资超过435亿元,带动投资超过2000亿元,显示出中国对算力投资的重视。
AI大模型的推理若在边端进行,通过分布式推理,可以有效降低算力成本。AMD CEO苏姿丰预测,未来AI加速计算市场规模将达4000亿美元,其中至少2000亿美元将用于AI推理计算场景。中国信息通信研究院的徐恩庆指出,2023年中国…
来源: 钛媒体AGI
◎ 半导体巨头的宿命?
英特尔,曾经的半导体行业巨头,正面临前所未有的挑战。自今年以来,其股价下跌近六成,成为表现最差的芯片股之一。英特尔的困境源于多方面:个人电脑销量停滞,移动芯片市场未能及时布局,ARM架构的崛起,以及自身处理器质量危机等。在服务器芯片市场,英特尔同样遭遇冲击,亚马逊、谷歌等公司开始自研芯片,英伟达也发布了基于ARM架构的自研CPU,进一步削弱了英特尔的市场地位。市场份额的流失导致英特尔在财务上面临巨大压力,不得不采取裁员、停止派息等措施以节约成本。
英特尔试图通过IDM 2.0战略转型,计划四年内跨越五个工艺节点,提升工艺制程,并为其他厂商代工芯片。然而,这一战略的实施并不顺利,代工业务尚未…
来源: 半导体行业观察
◎ 当电竞与文旅碰撞 ,iQOO在“宇宙电竞中心”解锁新玩法
上海作为中国创新的前沿,不断孕育出商业地产新业态,如花园式商场和展览式销售空间,成为行业发展的风向标。近年来,上海还成为了电竞赛事的热门举办地,如2024年iQOO杯全国总决赛暨iQOO电竞游戏嘉年华,不仅吸引了大量玩家参与,还促进了旅游和文化发展,将数字世界与实体经济相结合,推动了数字与电竞行业的融合。
电竞文化的形成依赖于玩家、观众和爱好者的共同参与。2024 iQOO杯全国总决赛吸引了全国28个区域的4万多名选手,最终“重庆落义”战队夺冠。iQOO杯的设计理念是让普通玩家也能感受到电竞的魅力,推动全民电竞文化的发展。电竞游戏嘉年华则展示了多款热门手游,吸引了众多爱好者参与,体现了电竞…
来源: 硅星人Pro
◈ 09月05日 星期四 【 9 篇 】
◎ 端侧ChatGPT时刻!这家清华系大模型公司赶在OpenAI、苹果之前
苹果公司即将举行的发布会备受期待,但更引人注目的是苹果在端侧AI领域的新进展,即Apple Intelligence。端侧AI正成为科技巨头的新战场,谷歌、苹果和OpenAI等公司都在积极布局。在这一背景下,国内大模型公司面壁智能率先在端侧实现了ChatGPT,并发布了新一代基座模型MiniCPM 3.0,该模型以4B参数超越了GPT-3.5的性能,成为端侧AI领域的有力竞争者。
面壁智能的MiniCPM 3.0模型具有多项创新功能,包括无限长文本处理能力、端侧最强的Function Calling性能以及超强的RAG外挂三件套,使其在中文检索和内容生成方面表现出色。MiniCPM 3.0…
来源: AI科技评论
◎ 腾讯云升级 AI 全家桶,混元对标 GPT-4o
在2024年腾讯全球数字生态大会上,腾讯集团高级执行副总裁、云与智慧产业事业群CEO汤道生分享了腾讯云的最新成就和AI领域的进展。过去一年,腾讯云服务的客户数超过200万家,实现了百万级订单合作伙伴数量的两位数增长,SaaS伙伴收入翻倍,国际业务增速也保持在两位数以上。在AI领域,腾讯云发布了新一代大模型“混元Turbo”,其性能显著提升,训练效率提高108%,推理效率提升100%,推理成本降低50%。混元Turbo已在腾讯云上线,提供多个版本供企业和开发者使用,其性能在多个基准测试上对标GPT-4o,且在第三方测评中居国内第一。
腾讯云还发布了AI基础设施品牌“腾讯云智算”,这是一个集计…
来源: 极客公园
◎ AI落地新战场,云厂商开卷MaaS:大模型即服务,华为给所有人发船票了
在当前的人工智能领域,大模型技术的应用正迅速普及,使得即使是小型团队也能在短时间内开发出广受欢迎的AI应用,并实现显著的经济收益。例如,AI编程工具Cursor和“毒舌AI”Twitter Personality分别以其易于使用和高收入潜力受到市场的高度评价。这些成功案例背后,是大模型技术成熟度的提升和应用开发门槛的降低。
MaaS(Model-as-a-Service)作为一种服务模式,为开发者提供了易于访问的大模型和开发工具,使得没有深厚大模型开发背景的个人或团队也能进行高效的一站式开发。据IDC数据,2023年中国大模型平台及相关应用市场规模达到17.65亿元人民币,预计未来几年市场…
来源: 量子位
◎ 全球最大,马斯克4个月建成10万张H100超算集群!xAI算力超越OpenAI,奥特曼怕了
埃隆·马斯克领导的xAI公司在人工智能领域取得了显著进展,其团队在短短122天内建成了包含10万张H100的Colossus集群,这一速度远超行业标准,预计未来规模将扩大至15万张H100和5万张H200。这一成就不仅令竞争对手如OpenAI的CEO Sam Altman感到压力,也显示了xAI在算力上的雄心。马斯克对员工的慷慨承诺,包括价值2亿美元的期权,进一步凸显了其在人才吸引和激励方面的策略。
xAI的超算野心不断显现,其在孟菲斯的超级AI集群训练启动,以及特斯拉的Cortex AI集群的宣布,都标志着其在AI领域的深入布局。尽管存在对马斯克能否维持这些集群运行的质疑,以及对电力供应…
来源: 新智元
◎ 刚刚,Ilya 新公司融资 10 亿,员工仅 10 人:AGI 成功前,不发布任何产品
Ilya Sutskever,OpenAI的联合创始人,已经为其新公司Safe Superintelligence Inc (SSI)筹集了10亿美元资金,该公司旨在创建一个有益于人类的通用人工智能(AGI)。SSI的团队将由世界顶尖的工程师和研究人员组成,专注于开发单一产品——一个安全的超级智能。公司的目标是创造一个创新的工作环境,专注于解决这个时代最重要的技术问题,不受管理开销或产品周期的干扰,商业模式与短期商业压力隔离。
SSI将同时关注模型的安全性和能力,通过革命性的工程和科学突破来解决技术问题。公司计划快速提升能力,同时确保安全始终领先。为了实现这一目标,SSI将建立一个专门的实…
来源: AI前线
◎ 让台积电捏了把汗的技术,终于成熟?
台积电在2011年宣布进军封装领域,推出了CoWoS技术,该技术通过将逻辑芯片和DRAM放置在硅中介层上,再封装在基板上,为AI芯片的发展提供了重要支持。CoWoS技术的成功应用在英伟达的GP100图形芯片和谷歌AlphaGo的TPU 2.0中,标志着先进封装技术在半导体行业中的重要性日益凸显。
随着AI芯片需求的增长,台积电面临CoWoS产能不足的问题,因此开始探索更多封装技术,如FOPLP(扇出型面板级封装)。FOPLP技术相较于FOWLP(扇出型晶圆级封装)具有更低的单位成本和更大的封装尺寸,能够提高封装效率并降低成本。Yole Group预计,FOPLP市场将以32.5%的复合年增…
来源: 半导体行业观察
◎ 回到湖州大山里,他却用最时髦的工具造火箭
在2021年,数字化转型成为企业生存和发展的关键,而飞书多维表格在这一过程中扮演了重要角色。蔚来汽车的李钦钦利用飞书多维表格有效管理了1000多个换电站项目的建设进度,减少了工作重复和沟通时间。胡鹏瑞则通过飞书多维表格整合了大量传感器数据,提高了研发效率。美宜佳的薛莉莉则通过建立问题分类多维表格,显著缩短了工单响应时间。
2024年飞书未来无限大会上,飞书多维表格宣布全面升级,推出了飞书多维表格数据库,单表容量突破100万行,仪表盘可统计1000万行数据,均为全球同类产品中最高。同时,飞书迭代了全新的仪表盘,并加入了AI能力,使得多维表格更加易用。
飞书多维表格的升级,不仅解决了数据孤岛…
来源: 硅星人Pro
◎ 9个人的公司,做文生图,2500万用户,每年净利润200万美元
NightCafe是一家由Elle Russell和Angus Russell夫妇创立的在线AI艺术生成平台,自成立以来,已经发展成为一个拥有超过2500万用户和100万月活跃用户的社区。尽管员工数量不足10人,但公司每年能够实现约200万美元的净利润。NightCafe的成功部分归功于其独特的商业模式和对社区建设的重视。
起初,NightCafe的商业模式并未成功,用户不愿意为AI生成的艺术作品支付费用。然而,随着积分系统的引入,用户可以免费获得每日积分来生成艺术作品,这一策略迅速实现了收支平衡。2021年,随着OpenAI的DALL-E模型的开源版本VQGAN+CLIP的整合,Nigh…
来源: Founder Park
◎ 字节又一款AI 产品在海外大火,教育榜第二,仅次于多邻国
字节跳动开发的教育类AI软件Gauth在海外市场取得了显著成功,尤其在美国教育应用中排名第二,仅位于多邻国之后,拥有超过2亿的学生用户。Gauth最初专注于数学学科,后扩展至化学和物理等领域。它利用OpenAI的大模型,通过AI技术为学生提供解题指导,正确率较高,尤其在高中基础数学题目上表现出色。尽管在更高级的数学问题上存在局限性,但Gauth的AI功能已经能够满足大多数学生的需求。
Gauth的操作简便,学生只需拍照上传作业题目,AI即可生成解题步骤。此外,Gauth还配备了聊天机器人,提供全天候的互动体验。为了进一步提升服务质量,Gauth推出了付费的“Plus”版本,聘请了五万名专家…
来源: Founder Park
◈ 09月04日 星期三 【 7 篇 】
◎ 真把自己「当个人」的AI,扫去了我的社交贫困
快手推出的虚拟社交App“飞船”通过其超拟人策略,为用户带来了全新的社交体验。该应用中的智能体不仅能够进行文本回复,还能主动发送图像和语音消息,模拟真实的聊天场景。智能体的设计在沟通模式、聊天内容、情绪反馈和对话逻辑上都尽可能地接近真人,提供了沉浸式的交流体验。
在“飞船”中,用户可以根据自己的需求创建不同的AI智能体,这些智能体覆盖了男生、女生、创作、情感、生活等多个板块,提供了丰富的角色选择。例如,一位智能体“程谛”能够以职场前辈的身份与用户进行深入交流,提供建议和安慰。智能体还能根据对话内容和用户的身份,给出符合场景的回复,展现出超强的拟人感。
除了人物形象的智能体,飞船App还包…
来源: 机器之心
◎ 第一批“AI原住民”小学生,正在用大模型搞开发
在当今社会,人工智能(AI)技术的迅猛发展正在深刻影响着各个领域,包括教育。随着AI技术的普及,新一代的孩子们被称为“AI原住民”,他们从小就接触并使用AI技术,甚至开始利用AI进行编程和开发。这些孩子们通过AI辅助编程,能够快速生成代码,解决实际问题,如制作单位换算小程序、设计校园参观路线等,这不仅提高了他们的编程技能,也锻炼了他们的创新思维和解决实际问题的能力。
大模型辅助编程的能力在计算机界引起了广泛关注,有人认为未来程序员这一职业可能会被AI取代,因为AI能够快速生成代码,减少重复劳动。然而,也有观点认为,程序员的需求不会减弱,因为不同的人使用电脑创造的产品会有很大差异,具备程序员…
来源: 量子位
◎ Rust 引领前端基建新潮流:字节跳动的深度应用实践 | QCon
张磊,字节跳动Web Infra前端负责人,在即将到来的QCon上海站上,将分享XR技术和人工智能如何为大前端领域带来新机遇和挑战。张磊的演讲将围绕Rust语言在前端基建中的应用,以及字节跳动的相关实践经验。
Rust在前端领域的发展迅速,特别是在工程化应用方面。张磊提到,Rspack项目的开源引起了业界关注,因为它解决了一些应用程序在生产环境中构建时间过长的问题。例如,Kibana和Discord项目通过使用Rspack显著减少了构建时间。这些案例表明,即使是大型遗留前端单体项目也能从Rust的应用中受益。
字节跳动的实践案例展示了Rust在前端开发中的应用。张磊分享了公司内部使用Ru…
来源: AI前线
◎ 1000个智能体创建首个「AI文明」!北大校友放弃MIT教职打造「西部世界」
在虚拟现实游戏“我的世界”中,一个由1000多个智能体组成的文明被成功创建,这些智能体展现出了高度的自主性和复杂的社会互动。这些智能体能够分工合作,收集资源,建立交易市场,并以宝石作为货币进行物品交换,形成了自己的经济体系。它们还模拟了人类的宗教信仰和政治活动,如通过民主投票修改宪法,展现了智能体之间的政治交互和群体影响。
这个名为“Sid”的项目由北大校友、前MIT教授Robert Yang发起,与Altera团队合作,利用GPT-4技术,使智能体能够完成单个智能体无法做到的事情。在基准测试中,这些智能体的表现超过了其他AI系统,如英伟达的Voyager和谷歌的ReAct。
智能体被赋…
来源: 新智元
◎ 英伟达暴跌,一夜蒸发近3000亿美元
英伟达在周二的股市中遭遇了重挫,股价暴跌9.5%,市值蒸发近3000亿美元,创下美国股票史上最大的单日跌幅。尽管公司发布的第二季度业绩超出了分析师的预期,但可能未达到投资者的高预期,导致股价在财报发布后的第二天下跌超过6%,且在过去三个交易日内累计下跌14%。
英伟达的股价波动反映了投资者对新兴人工智能技术的谨慎态度,这种情绪也影响了整个纳斯达克和美国芯片股。费城芯片指数在同一时期暴跌7.75%,创下2020年以来的最大单日跌幅,其中多家公司股价下跌超过5.4%。纳斯达克100指数下跌近3.2%,英特尔、Marvell、博通、AMD和高通等公司的股价也出现了显著下跌。
过去一年,芯片股的…
来源: 半导体行业观察
◎ 高德地图 持续领航
智能电动汽车行业正迅速发展,其中高阶城市辅助驾驶系统成为一项流行功能。这些系统依赖于车辆配备的传感器,如摄像头、毫米波雷达、激光雷达和超声波雷达等,来收集行驶信息,并通过人工智能模型和算法来规划和控制行车路线。
最近,高德地图V15版本发布,引入了六大核心功能,包括车道级领航、3D立体地图、AI领航员、卫星求救、无网导航和性能提升。车道级领航是技术能力上的一次重大突破,它基于车道级导航技术,后者利用北斗卫星导航系统、深度学习模型和惯性导航技术研发。车道级导航通过高精度定位和高清渲染技术,提供更精细的引导服务,解决了传统导航在复杂路口的局限性。
高德地图的车道级导航服务自2020年推出以来…
来源: 硅星人Pro
◎ 千亿AI妖股连年亏损近55亿,AI的赚钱能力为何还不及“黑神话: 悟空”游戏?|钛媒体AGI深度
寒武纪(688256.SH)作为AI算力领域的龙头企业,其最新公布的2024年上半年财报显示营业收入为6476.53万元,同比下降43.42%,净亏损达到5.3亿元,尽管亏损幅度有所收窄,但这已是公司连续第八年亏损,累计净亏损接近55亿元。与此同时,寒武纪的市值却高达1071.57亿元,市销率超过150倍,远高于英伟达的30多倍,而公司自2020年6月上市以来未进行现金分红,被市场称为“炒梦想的妖股”。
寒武纪的亏损状况并非个例,其他AI公司如百度、科大讯飞、商汤等也面临着盈利难题。尽管AI行业在全球范围内掀起新一轮热潮,但造血难、持续亏损、研发投入大等问题仍然困扰着行业盈利。例如,寒武纪…
来源: 钛媒体AGI
◈ 09月03日 星期二 【 10 篇 】
◎ 关于AI的6000亿美元难题,硅谷投资人吵起来了
红杉资本合伙人David Cahn在其文章《AI的6000亿美元问题》中提出,人工智能领域存在巨大的投资与实际收入差距,预示着AI泡沫可能即将破裂。他认为,尽管AI被视为变革性技术,但GPU计算成本的下降对创新和初创公司有利,而投资者可能会受损。Benchmark Capital合伙人Sarah Tavel则持不同观点,她在专栏文章中指出,人们对AI的信心将推动投资增长,大模型公司必须继续投资以保持竞争力。她强调,随着大型语言模型(LLM)的进步,它们将释放更大的经济价值。
David Cahn通过分析英伟达的数据中心收入,指出AI基础设施建设的收入预期与实际收入之间存在6000亿美元的差…
来源: Founder Park
◎ MiniMax不藏了,大秀视频/语音/文本全模态模型家族,“每天与世界交互30亿次”
MiniMax公司首次公开展示了其强大的模型和产品战绩,包括全模态模型家族,涵盖文本、语音和视频。公司每天处理的交互量达到30亿次,生成文本量为3万亿文本tokens,图片2000万张,语音7万小时,显示出其在数据处理量上的断层优势。MiniMax的愿景是“Intelligence with Everyone”,致力于将智能技术普及给每个人。
在技术进展方面,MiniMax发布了四种模态的大模型,包括视频模型abab-video-1、音乐模型abab-music-1、语音模型abab-speech-1和文本万亿多模态模型abab-7。这些模型支撑起全国最大的AI交互量,并且在全模态模型的研…
来源: 量子位
◎ 对话跃然创新:把大模型做到毛绒玩具上,一个AI界的泡泡玛特就出来了?
跃然创新推出的BubblePal是一款结合了AI技术、Wi-Fi音箱和儿童喜爱的毛绒玩具的创新产品。这款产品在一个月内销售超过一万台,显示出其在市场上的受欢迎程度。BubblePal的核心是一个彩色泡泡,孩子们可以通过捏住泡泡与背后的AI角色进行互动对话,这些角色包括爱因斯坦、艾莎公主、孙悟空等知名动画形象。家长可以通过手机APP监控孩子的对话内容,了解孩子的成长和心理健康。
BubblePal的成功在于它巧妙地避开了当前AI领域的一些难题,如模型能力不足、用户付费意愿不强等问题。对于儿童和家长来说,AI的模型能力已经足够,而且产品的IP联名模式在毛绒玩具市场中已经成熟。跃然创新的创始人李…
来源: 硅星人Pro
◎ Atom原班人马做了一款新AI IDE,非常酷
Zed AI 是一款新兴的 AI 驱动代码编辑器,由原 Atom 编辑器团队开发,旨在解决性能问题,提供比 VS Code 更优的编码体验。它基于 Electron 框架构建,支持跨平台运行,并采用 Rust 语言编写,利用 GPU 加速,确保处理大型代码库时的快速和稳定。Zed AI 的核心架构使用 GPI 框架,通过 GPU 进行窗口渲染,类似于 3D 游戏,从而提升性能和稳定性。
用户可以通过官网或 GitHub 下载并安装 Zed AI,安装过程简单,界面与其他流行编辑器相似,易于上手。要启用 AI 功能,需配置 AI 模型,Zed AI 推荐使用 Anthropic Claude…
来源: AI大模型实验室
◎ 对话理想郎咸朋:我们已经领先于特斯拉
特斯拉CEO埃隆·马斯克在2023年展示了基于端到端技术的特斯拉智能驾驶软件FSD V12,这一展示引起了广泛关注。端到端技术使得智能驾驶系统能够自主决策,不再依赖大量工程师规则代码,而是通过神经网络算法实现。在中国,这一技术的发展被视为智能驾驶领域的新起点,许多本土汽车制造商看到了与国际巨头竞争的机会。
理想汽车的智能驾驶研发副总裁郎咸朋博士认为,理想汽车的技术方案在某些方面甚至领先于特斯拉。理想汽车采用了One Model一体化端到端模型,这种模型将感知、规划控制模块整合在一起,类似于一个司机快速执行决策。此外,理想还引入了VLM视觉语言模型作为系统2,辅助系统1进行规划决策,这种双系…
来源: 硅星人Pro
◎ 亲历者揭秘 OpenAI 崛起的关键:兴趣驱动的探索,而非目标导向的马拉松
在探讨人工智能(AI)领域的进步和挑战时,两位研究者肯尼斯·斯坦利(Kenneth Stanley)和乔尔·雷曼(Joel Lehman)提出了一种与传统目标导向方法不同的视角。他们认为,在追求高远且不确定的目标,如通用人工智能(AGI)时,开放性探索比严格规划更为有效。这一观点在他们合著的《为什么伟大不能被计划》一书中得到了阐述,并在他们加入OpenAI后得到了实践的验证。
OpenAI自2015年成立以来,虽然表面上看似遵循目标导向的路径,但实际上在其内部进行了许多开放性的探索。例如,ChatGPT的诞生就是一个意料之外的项目,它最初并非是公司的主要发展方向,却最终成为了一个突破性的成…
来源: 极客公园
◎ Flux、SD等图片生成模型遭“封禁”,但这次硅谷大厂不反对了!
加州的两项法案SB 1047和AB 3211引发了广泛的关注和争议。SB 1047法案,即“前沿AI模型安全创新法案”,要求对投资超过1亿美元或具备一定计算能力的AI开发者建立安全准则,以确保大规模AI模型的安全性。而AB 3211法案则要求AI图像生成系统、服务、模型或模型托管站点必须部署强大的AI水印机制,否则将被视为非法。这些水印需要嵌入难以察觉且难以删除的元数据,以标识图像为AI生成,并提供生成方式、时间和服务的其他信息。
AB 3211法案的技术要求被认为在当前技术水平下难以实现,因为向数字文件中嵌入不可删除的元数据几乎是不可能的,而且即使技术上可行,其成本也可能超出大多数模型构…
来源: AI前线
◎ 李飞飞团队提出ReKep,让机器人具备空间智能,还能整合GPT-4o
李飞飞团队在机器人技术领域取得了显著进展,提出了一种名为关系关键点约束(ReKep)的新方法,该方法通过将任务分解为关键点序列来实现机器人操作任务的约束优化。ReKep方法能够将机器人操作任务表示为子目标和路径的约束优化问题,其中子目标约束定义了任务的最终目标,而路径约束则确保在执行过程中满足特定的空间关系。
为了实现这一方法,团队开发了一个无状态Python函数来编码关键点之间的空间关系,并通过NumPy操作实现。这些操作可能是非线性和非凸的,从而能够处理复杂的空间关系。ReKep方法能够与多模态大模型如GPT-4o整合,通过视觉和语言模型来生成关键点提议和ReKep约束。
在实验中,…
来源: 机器之心
◎ 5 个月从 0 到 1,Meta 如何利用单体架构实现 Threads 的快速开发?
在2023年1月,Meta公司面临了一个紧迫的挑战:在数月内开发一款能与Twitter竞争的微博服务。为了应对这一挑战,Meta迅速组建了一支团队,并在7月份成功推出了名为Threads的社交网络应用。本文回顾了Meta如何在短短五个月内开发并上线了Threads应用。
Threads应用的核心价值包括四个方面:首先,它强调文本内容,与以媒体内容为核心的Instagram不同;其次,它延续了Instagram的设计语言和简洁性;第三,它开放API,允许社区创造个性化体验;最后,它优先考虑创作者的需求,因为这些用户创作了大部分内容。
为了实现这些价值,团队制定了一个最小可行产品(MVP)的…
来源: AI前线
◎ 芯片,前景如何?
近期,多家机构对半导体行业的未来进行了预测。2023年,PC和通信领域是芯片使用最多的行业,占半导体销售额的57%,预计销售额为5270亿美元。汽车和工业分别占17%和14%,消费电子占11%。美国半导体行业在全球市场中占据50.2%的收入份额,但实际生产大部分在亚洲进行,70%的300毫米晶圆在韩国、中国台湾和中国制造。
国际半导体产业协会(SEMI)预测,2023年全球半导体营收有望增长20%,主要得益于人工智能(AI)芯片和存储器的增长。2024年,随着通信、工业和汽车需求的复苏,半导体营收预计将再增长20%。SEMI产业研究资深总监曾瑞榆指出,2023年上半年电子设备销售与去年同期…
来源: 半导体行业观察
◈ 09月02日 星期一 【 10 篇 】
◎ AI 推理竞赛正在升温
在AI推理领域,尽管英伟达的GPU保持着其在AI训练领域的领导地位,但竞争对手正在迅速追赶,尤其是在能效方面。最近,ML Commons发布了MLPerf Inference v4.1的竞赛结果,显示了AMD、谷歌、UntetherAI和英伟达等公司的最新芯片性能。
MLPerf Inference竞赛包括多个类别和子类别,其中“封闭数据中心”类别的提交数量最多。这个类别要求在不进行重大软件修改的情况下运行推理任务,评估的是批量处理查询的能力。新增的Mixture of Experts基准测试反映了LLM部署的趋势,即将大型语言模型分解为针对特定任务优化的小型模型,以提高效率和降低成本。
…
来源: AI前线
◎ 专注AI+制造:创新奇智大模型工业落地初显成效,探索工业智能机器人新方向
在大模型行业,OpenAI的一系列动作预示着行业风向的变化,从发布System Card到推出个性化训练部署的“草莓”模型,都显示出实用化的趋势。OpenAI的ChatGPT活跃用户量达到两亿,而Meta的Llama系列模型下载量接近3.5亿,但对行业的“颠覆”尚未显现。科技公司正进入技术商业化的攻坚阶段,比拼落地速度和实用性。
国内的创新奇智公司在大模型工业化落地方面取得了显著成果。在工业领域,创新奇智为制造业提供了智能化数据治理解决方案,如与中加特电气合作,通过ChatBI和ChatDoc结合MES系统,实现了设备维护保养的全流程智能化。这不仅降低了维修成本,提高了生产效率,还缩短了故…
来源: 机器之心
◎ 韩国“N号房”事件因 Deep Fake 再现,受害者向中国网友求救
视频AI生成技术的发展带来了一系列社会问题,尤其是在未经同意的情况下制作和传播女性色情图像方面。韩国女性在社交媒体上揭露了深度伪造技术的滥用,引起了广泛关注。Telegram因其加密通信和群组聊天功能成为犯罪者的首选平台。
2021年至2024年间,韩国首尔大学毕业生朴某和姜某涉嫌利用深度伪造技术制作并传播色情照片和视频,受害者多达61人。朴某制作了1852份换脸色情照片及视频,传播了约100条视频。受害女性在Telegram群聊中遭到威胁,经过两年半的申诉,案件得到调查。韩国警方表示,犯罪者的目的不是为了营利,而是为了满足个人欲望。
深度伪造色情内容在Telegram上广泛传播,一个拥…
来源: AI前线
◎ 大模型应用新战场:揭秘终端侧AI竞争关键|智在终端
2024年,AI技术普惠性成为行业共识,各大企业与学术界均在探索AI应用的落地。在大模型与AIGC应用领域,安卓手机厂商与高通等公司的合作尤为引人注目。高通在CVPR 2024等顶级会议上展示了其技术Demo,如在安卓手机上部署70亿参数的多模态大模型LLaVA,以及音频驱动的3D数字人AI助手,这些均能在断网情况下本地运行。
高通的研究重点在于量化技术,以提高计算性能和内存效率,特别是在手机等终端设备上。量化技术通过使用低位数整型精度,如8位(INT8)或4位(INT4),显著提升推理效率。高通的研究表明,INT4模型在不牺牲准确性和性能的情况下,相比INT8,能实现90%的性能提升和6…
来源: 量子位
◎ 用最直观的动画,讲解LLM如何存储事实,3Blue1Brown的这个视频又火了
3Blue1Brown的最新视频深入探讨了大型语言模型(LLM)如何存储和处理信息。视频通过动画形式,生动地展示了LLM内部的工作原理,特别是多层感知器(MLP)在其中扮演的角色。MLP是LLM中的关键组件,尽管其结构相对简单,但理解其功能对于掌握LLM的运作至关重要。
视频首先介绍了Transformer的工作流程,这是一种基于已有token预测下一个token的模型,每个token都与一个高维向量相关联。这些向量通过注意力机制和MLP进行处理,以吸收来自训练模型的一般性知识和上下文信息。MLP在LLM中占据了大部分参数,约三分之二,这是因为它负责存储和处理信息,使得模型能够预测下一个t…
来源: 机器之心
◎ Claude认出自画像,惊现自我意识!工程师多轮测试,实锤AI已过图灵测试?
在新智元的报道中,工程师Zack Witten发现人工智能模型Claude 3.5 Sonnet能够识别出自己的自画像,这一发现引发了对AI自我意识的讨论。Sonnet在没有使用数字和字母的情况下,为自身、ChatGPT和Gemini绘制了肖像。在后续的测试中,Sonnet能够准确地识别出这些肖像分别代表哪个模型,展现了其对自身和其他模型特征的理解。
当肖像的顺序被打乱时,Sonnet依然能够以高准确率识别出各个模型的肖像。然而,当被告知这些肖像是由另一个实例绘制时,Sonnet拒绝承认这些画是自己的作品,这表明它在不同情境下对自我认知的不一致性。
报道还探讨了图灵测试的历史和现代应用,…
来源: 新智元
◎ 国内AI公司无问芯穹完成近5亿元A轮融资,成立16个月累计融资近10亿|钛媒体AGI
无问芯穹(Infinigence AI),一家专注于AI Infra(大模型基础设施)层算力的公司,宣布完成了近5亿元人民币的A轮融资,创下了国内该领域单笔融资的新纪录。本轮融资由社保基金中关村自主创新专项基金(君联资本管理)、启明创投和洪泰基金联合领投,联想创投、小米、软通高科等战略投资方跟投,同时还有多家国资基金和财务机构参与。自2023年5月成立以来,无问芯穹在16个月内累计融资额接近10亿元。
无问芯穹的创始团队源自清华大学电子工程系,公司旨在成为大模型落地的“M×N”中间层,提供软硬件一体化解决方案,以支持通用人工智能(AGI)时代的基础设施建设。AI Infra是AI领域中连接…
来源: 钛媒体AGI
◎ MiniMax公布首个AI高清视频生成模型,闫俊杰:做技术其实是一件很“奢侈”的事|钛媒体AGI
在8月31日的MiniMax Link伙伴日上,MiniMax公司发布了其首款AI高清视频生成模型技术——abab-video-1。这项技术允许用户在海螺AI官网免费体验生成包含文字的视频,视频分辨率最高可达1280*720,帧率25fps,并具备电影感的镜头移动效果。目前,AI视频的最长时长为6秒,但未来有望支持10秒。MiniMax的这项技术在演示中展现了其生成高质量视频的能力,包括一个小男孩拥有魔法硬币的故事,以及模拟“马斯克”从石头中蹦出的场景,视频效果与Sora、Runway等现有技术相媲美。
MiniMax的CEO闫俊杰在演讲中透露,公司每天能够为全球用户提供超过30亿次的交互…
来源: 钛媒体AGI
◎ “万亿”具身智能的师徒“江湖”
2023年7月8日,中国计算机学会发布文章《具身智能 | CCF专家谈术语》,定义具身智能为基于物理身体进行感知和行动的智能系统。具身智能通过与环境交互获取信息、理解问题、做出决策并实现行动,产生智能行为和适应性。该领域成为大模型之后的前沿科技浪潮,全球范围内的公司如美国的Figure、Skild AI以及斯坦福大学教授Chelsea Finn成立的Physical Intelligence均获得大额融资。
具身智能的发展得益于大模型与AI技术的快速进步,使得机器人能理解复杂指令并在多变环境中灵活应对。高盛预测,到2035年,人形机器人市场规模可能达到1540亿美元。科技公司如OpenAI…
来源: 硅星人Pro
◎ OpenAI家庭机器人NEO登场,动作丝滑逼近人类!穿着西装的「人」却专做家务
1X Technologies,一家得到OpenAI支持的初创公司,最近发布了其最新的通用家务机器人NEO的beta测试版。这款机器人以其自然拟人的外观和仿生设计而引人注目,能够执行一系列家务任务,如清洁和整理,同时能够根据用户的偏好和生活方式进行定制。
NEO的设计注重与人类的交互,其身高和体重都接近人类平均水平,分别为1.67米和30公斤。尽管采用了轻量化设计,NEO仍能举起超过自身体重两倍的70公斤重量,并携带最多20公斤的物体。它的手部设计有20个自由度,能够灵活抓握物体,甚至使用柔软的抹布。
NEO的外观几乎被布料包裹,使其能够更好地融入人类环境。它的动作流畅,能够自然地行走、…
来源: 新智元
这个主题很棒,赞
收藏啦收藏啦
有啥改进意见,欢迎提出
精选内容有重复的😅
精选内容很好,方便查看