AI大模型

1000行C语言搓出GPT-2！AI大神Karpathy新项目刚上线就狂揽2.5k星

AI研究者Andrej Karpathy最近发布了一个引人注目的项目，该项目展示了如何仅使用大约1000行的纯C语言代码来训练GPT-2模型，而不依赖于庞大的PyTorch和cPython...

AIGC动态

2年前 (2024)

Transformer模型自问世以来，已经在自然语言处理（NLP）领域取得了革命性的进展，并且其影响力已经扩展到了NLP之外的其他领域。Transformer的核心特点在于其...

AIGC动态

2年前 (2024)

随着大型语言模型（LLMs）在计算机视觉领域的成功，研究者们对于图像分割基础模型的探索日益增加。Segment Anything Model（SAM）作为一个先进的图像分割基础...

AIGC动态

2年前 (2024)

2021年底，OpenAI面临数据供应短缺，耗尽了互联网上所有质量稳定的英语文本库。为开发下一代AI系统，他们开发了Whisper语音识别工具，转录YouTube视频中的音...

AIGC动态

2年前 (2024)

Andrej Karpathy，前特斯拉Autopilot负责人和OpenAI科学家，近日发布了一个名为「llm.c」的项目，该项目仅使用大约1000行纯C语言代码，就能在CPU/fp32上实现G...

AIGC动态

2年前 (2024)

Andrej KarpathyAndrej Karpathy，一位在人工智能领域享有盛誉的大神，近期复出并带来了一项引人注目的项目：使用纯C语言实现GPT的训练，仅用1000行代码就完...

AI-Agent

2年前 (2024)

最近，AI代码生成领域迎来了一位资深玩家——aiXcoder，它推出了一款专门适用于企业软件开发场景的代码大模型——aiXcoder-7B Base版。这个模型虽然只有70亿参数...

AIGC动态

2年前 (2024)

上个月，彭博社报道了苹果公司正在与谷歌进行谈判，希望将谷歌的AI系统Gemini集成到iPhone中，以增强iPhone的AI功能。这一消息引起了业界的广泛关注，因为苹...

AIGC动态

2年前 (2024)

在近期的研究中，斯坦福助理教授杨笛一及其团队提出了利用大语言模型（LLM）来训练社交技能的新方法。这项研究认为，通过大语言模型的帮助，社交技能训练可以...

AIGC动态

2年前 (2024)

大语言模型的“逆转诅咒”问题，即模型无法理解“如果A是B，则B是A”的逻辑关系，已经被Meta FAIR的研究人员通过一种新的反向训练方法得到改进。这个问题最初在去...

AIGC动态

2年前 (2024)