大模型

腾讯LLaMA Pro大模型：突破大模型微调的知识遗忘难题

1. 引言：大模型微调中的挑战 - 大型语言模型（LLM）的微调在提升模型性能上起着关键作用，但面临知识遗忘的挑战。 - 香港大学的研究团队联合腾讯ARC实验...

AIGC动态

2年前 (2024)

这篇文章主要介绍了使用大型语言模型（LLMs）作为代理系统的概念，重点介绍了ReAct代理的内部工作原理和挑战。文章首先解释了LLM Agent的定义和其在任务完成...

AI-Agent

2年前 (2024)

第二段：讲述了StreamingLLM的优势和挑战，以及其通过观察注意力模块中Softmax的输出，解决了注意力 sink 的现象，提高了生成效果。第三段：介绍了Colossal-A...

AIGC动态

2年前 (2024)

这篇文章主要介绍了最新的LLMs（大型语言模型）排行榜，其中谷歌的Bard模型在Imsys的LLMs排位赛上超过了GPT-4，跃居第二名。排行榜由UC伯克利研究人员主导的L...

AIGC动态

2年前 (2024)

这篇文章主要讨论了Docker和Kubernetes（K8s）以及人工智能领域的发展趋势。首先介绍了Docker的优势，以及K8s对Docker的影响，类比了GPT和Agent的关系。然后...

AI-Agent

2年前 (2024)

这篇文章主要介绍了如何使用不同的大语言模型（LLM）来搭建对话式RAG应用。首先，作者提到了OpenAI以外的其他LLM，包括Nebula和Hugging Face的Embedding模型...

AIGC动态

2年前 (2024)