学习AIGC 学习AIGC 学习AIGC 学习AIGC
  • AI重点推荐
    • 重点推荐
    • ChatGPT
  • AI通用平台
    • 国内平台
    • 国外平台
    • 开放平台
    • 智能助手
    • 开源模型
  • AI智能绘画
    • 艺术创作
    • 修复处理
    • 图库工具
  • AI智能视频
    • 视频创作
    • 编辑处理
    • 数字人
  • AI智能音频
    • 音频创作
    • 高效工具
  • AI智能设计
    • 设计平台
    • 图标素材
  • AI智能办公
    • 文档表格
    • 效率提升
    • 思维导图
    • 会议工具
    • 语言翻译
  • AI智能工具
    • 文案写作
    • 提示技巧
    • 编程助手
    • 搜索助手
    • 其他助手
  • AI学习开发
    • 开发框架
    • 模型社区
    • 教育学习
    • Github库
  • AI其他分类
    • 智能游戏
  • 免费DeepSeek满血版
  • 绘蛙-AI视频生成
  • 提交网站
  • 友情链接
学习AIGC 学习AIGC
  • Trae-AI IDE
  • AI视频生成
  • AI每日资讯
  • 学习材料
  • 文章分类
    • 全部文章
    • 机器人
    • AI-Agent
    • 图像生成
    • 视频生成
    • 音频生成
    • GPT-GPTs
    • LangChain
  • 联系我们
网站文章

“强化学习”的搜索结果

强化学习也能预训练?效果可提升20倍,华人新作引爆RL新范式!
强化学习也能预训练?效果可提升20倍,华人新作引爆RL新范式!

大规模预训练和微调的模式在...

重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练
重磅!淘天联合爱橙开源强化学习训练框架ROLL,高效支持十亿到千亿参数大模型训练

过去几年,基于人类偏好的强...

从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南
从RLHF、PPO到GRPO再训练推理模型,这是你需要的强化学习入门指南

强化学习已成为大型语言模型...

「Next-Token」范式改变!刚刚,强化学习预训练来了
「Next-Token」范式改变!刚刚,强化学习预训练来了

在人工智能领域,强化学习(R...

大模型是「躲在洞穴里」观察世界? 强化学习大佬「吹哨」提醒LLM致命缺点
大模型是「躲在洞穴里」观察世界? 强化学习大佬「吹哨」提醒LLM致命缺点

加州大学伯克利分校副教授Ser...

首次解释LLM如何推理反思!西北大学谷歌新框架:引入贝叶斯自适应强化学习,数学推理全面提升
首次解释LLM如何推理反思!西北大学谷歌新框架:引入贝叶斯自适应强化学习,数学推理全面提升

西北大学与Google、谷歌DeepM...

SFT在帮倒忙?新研究:直接进行强化学习,模型多模态推理上限更高
SFT在帮倒忙?新研究:直接进行强化学习,模型多模态推理上限更高

随着OpenAI的o1/o3和Deepseek...

AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号
AI仅凭“自信”学会推理,浙大校友复刻DeepSeek长思维链涌现,强化学习无需外部奖励信号

复刻DeepSeek - R1的长思维链...

搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核
搞不懂CUDA的人有救了,Devin开发商开源Kevin,强化学习生成CUDA内核

Cognition AI 近期开源了一款...

VDC+VBench双榜第一!强化学习打磨的国产视频大模型,超越Sora、Pika
VDC+VBench双榜第一!强化学习打磨的国产视频大模型,超越Sora、Pika

复旦大学等机构在视频生成领...

1 2 3 … 422

Trae-AI IDE

trae

极客训练营-扫码领取免费材料

极客时间-训练营

讯飞文书-办公助手

讯飞文书

有言AI-视频创作

有言AI-视频创作

热门网址

讯飞星火大模型
讯飞星火大模型
DeepSeek
DeepSeek
OpenAI DALL-E 3
OpenAI DALL-E 3
讯飞星辰Agent开发平台-官网
讯飞星辰Agent开发平台-官网
言笔AI
言笔AI
讯飞绘镜-官方网站
讯飞绘镜-官方网站
AI大学堂
AI大学堂
LiblibAI-哩布哩布AI – 中国领先的AI创作平台
LiblibAI-哩布哩布AI – 中国领先的AI创作平台
Bylo.ai: 免费的 AI 图像生成器
Bylo.ai: 免费的 AI 图像生成器
Galileo AI-生成UI界面
Galileo AI-生成UI界面
awesome-generative-ai-guide
awesome-generative-ai-guide
Midjourney
Midjourney
硅基流动
硅基流动
快手云剪
快手云剪
AcademicIdeas – 学境思源AI论文写作
AcademicIdeas – 学境思源AI论文写作
Maxun | Open-Source No-Code Web Data Extraction Platform
Maxun | Open-Source No-Code Web Data Extraction Platform
Copyright © 2025 学习AIGC 沪ICP备2022026704号-4 由 OneNav 强力驱动