标签:大语言模型
英伟达开源大模型对齐框架—NeMo-Aligner
本文主要介绍了英伟达开源的安全对齐框架NeMo-Aligner,旨在帮助开发人员提升大语言模型(LLM)的安全性能和稳定输出。随着大模型产品如ChatGPT和Midjourney...
AlphaGo核心算法增强,7B模型数学能力直逼GPT-4,阿里大模型新研究火了
阿里巴巴的研究人员最近提出了一种名为AlphaMath的方法,该方法利用蒙特卡洛树搜索(MCTS)增强大语言模型(LLM)的性能,特别是在数学推理任务上。这项研究...
苹果开源OpenELM,大模型开源领域再迎一巨头!
4月24日,苹果开源了针对手机等移动设备的大语言模型OpenELM,与微软的Phi-3 Mini类似,提供了指令微调和预训练两种模型,分别有2.7亿、4.5亿、11亿和30亿4种...
Llama3来了!Meta:如果我给每人发一个GPT-4,阁下如何应对
今天,Meta正式发布了他们迄今为止最强大的新一代开源大语言模型Llama3。Llama3的发布包括两个版本:Llama3 8B和Llama3 70B,它们分别拥有80亿和700亿参数,...
聊聊 Kimi Chat 的种草现象
文章摘要 【关 键 词】 Kimi Chat、月之暗面、大语言模型、增长潜力、AI技术 月之暗面公司推出的大语言模型产品Kimi Chat自2023年推出以来,...
中文OCR超越GPT-4V,参数量仅2B,面壁小钢炮拿出了第二弹
面壁智能,一家源自清华大学的创业公司,近期在大语言模型领域取得了显著进展。该公司致力于优化语言模型,以提高效率并降低成本。今年2月,面壁智能发布了第...
超越GPT-4V,苹果多模态大模型上新!
苹果发布了最新的多模态大语言模型(MLLM)Ferret-UI,该模型在理解和与屏幕信息交互方面表现出卓越性能,超越了GPT-4V。Ferret-UI专为理解移动UI屏幕而设计...
杨笛一新作:社恐有救了,AI大模型一对一陪聊,帮i人变成e人
在近期的研究中,斯坦福助理教授杨笛一及其团队提出了利用大语言模型(LLM)来训练社交技能的新方法。这项研究认为,通过大语言模型的帮助,社交技能训练可以...
破解36年前魔咒!Meta推出反向训练大法消除大模型「逆转诅咒」
大语言模型的“逆转诅咒”问题,即模型无法理解“如果A是B,则B是A”的逻辑关系,已经被Meta FAIR的研究人员通过一种新的反向训练方法得到改进。这个问题最初在去...
OpenAI曾转录100万小时视频数据,训练GPT-4
随着人工智能技术的飞速发展,大语言模型(LLM)已成为科技巨头们争夺的新战场。专注于AIGC领域的专业社区密切关注着微软 & OpenAI、百度文心一言、讯飞星火...