标签:大语言模型

亚马逊线下店 AI 训练失败:离不开 1000 名审核人员

亚马逊的“拿货即走”技术,一度被视为零售业的一大创新,旨在通过AI视频监控系统实现无需收银员的购物体验。然而,这项技术并未达到预期效果,导致亚马逊不得...

“弱智贴吧”的数据,居然是最强中文语料库

随着人工智能的快速发展,大语言模型(LLM)在多个领域的应用变得越来越广泛。专注于AIGC领域的专业社区特别关注了微软 & OpenAI、百度文心一言、讯飞星火等...

Cohere发布RAG增强版大模型并开源权重,支持中文、1040亿参数

近年来,人工智能生成内容(AIGC)领域迅速发展,特别是大语言模型(LLM)的进步引起了广泛关注。4月5日,Cohere这家专注于类ChatGPT平台的公司发布了一款名...

OpenAI发布全新微调API :ChatGPT支持更详细可视化微调啦!

OpenAI近期宣布了针对其大语言模型(LLM)的6个全新微调API功能,这些功能旨在帮助企业和开发人员构建更加特定领域和精细化的ChatGPT应用。这些新增功能包括...

华为诺亚频域LLM「帝江」:仅需1/50训练成本,7B模型媲美LLaMA,推理加速5倍

机器之心专栏近期介绍了一种基于频域的大语言模型架构——帝江,这一架构旨在解决现有大型Transformer模型在推理成本和训练成本上的问题。帝江模型通过频域自注...

开源大模型AI代理操作系统:像Windos一样,操控AI代理

内存管理器则负责管理短期内存资源,为AI代理提供高效的临时存储。它确保了内存资源的高效利用,并通过访问管理器实现不同代理之间的内存隔离。未来,AIOS计...

文本直接生成2分钟视频,即将开源模型StreamingT2V

  文章摘要 【关 键 词】 AIGC、大语言模型、视频生成、技术创新、StreamingT2V 近年来,人工智能生成内容(AIGC)领域取得了显著进展,特别是在大...

DeepMind终结大模型幻觉?标注事实比人类靠谱、还便宜20倍,全开源

DeepMind最近提交的一篇论文《Long-form factuality in large language models》引发了热议。该论文提出了一种新的方法,可以对大语言模型的长篇事实性进行评...

首个基于SSM-Transformer混合架构,开源商业大模型Jamba

AI研究实验室AI21最近开源了其基于SSM-Transformer混合架构的商业大模型——Jamba。这个模型在传统的Transformer架构上加入了结构化状态空间模型 (SSM) 技术,...

谷歌推出”自我发现“框架,极大增强GPT-4等大模型推理能力

本文主要介绍了谷歌Deepmind和南加州大学研究人员提出的一种用于大语言模型的通用框架——SELF-DISCOVER,它能自行发现任务内在的推理结构,以解决对典型提示方...
1 4 5 6 7 8 10