GPT-GPTs
GPT,GPTs,Prompt
千人千面的真人级AI名师,劈开教育「不可能三角」
教育行业长期面临规模、质量与成本难以兼顾的困境,而「与爱为舞」公司开发的AI导师系统通过技术创新实现了突破。该系统已服务百万级用户,其核心在于将通用...
世界首个!李飞飞团队推出物理推理基准,大模型统统不及格?
斯坦福大学与中国科学技术大学的研究团队开发了首个定量评估视觉语言模型(VLMs)物理理解能力的基准测试QuantiPhy。该测试包含超过3355个视频-文本问答对,...
2025年消费级AI现状报告:产品亮点、遗憾与未来趋势
2025年标志着消费级AI技术从实验室大规模进入日常生活场景,但市场竞争格局呈现高度集中化特征。ChatGPT以8-9亿周活跃用户数保持绝对优势,90%的用户仅使用单...
AI医生终于有了硬标尺!全球首个专病循证评测框架GAPS发布,蚂蚁联合北大王俊院士团队出品
蚂蚁健康与北京大学人民医院王俊院士团队联合发布了全球首个专病循证能力评测框架GAPS(Grounding, Adequacy, Perturbation, Safety),旨在解决现有医疗AI评...
本周AI项目推荐:AI 还会诞生它的“今日头条”吗?
AI技术正在重塑新闻客户端的形态,多个新兴产品试图通过深度整合AI能力颠覆传统信息获取方式。尽管GPT技术引发了对新闻行业变革的期待,但受限于模型能力、成...
Agent「记吃不记打」?华为诺亚&港中文发布SCOPE:Prompt自我进化,让HLE成功率翻倍
在LLM Agent领域,一个普遍存在的问题是Agent无法从错误中有效学习,导致重复相同的错误。华为诺亚方舟实验室与香港中文大学联合发布的SCOPE框架,通过动态优...
别想休假!OpenAI圣诞放狠招,程序员假期变代码马拉松
OpenAI在圣诞季推出特别版Codex模型GPT-5.2-Codex-XMas,通过提升使用上限和重置速率限制,为开发者提供节日期间的编程便利。该模型功能与标准版一致,但增加...
我把这一年的AI聊天记录,让AI做人生总结后,我破防了。
在年末自我复盘的热潮中,一位深度依赖多款AI工具的用户尝试通过全年聊天记录完成独特的年终总结。 最初设想将ChatGPT、Gemini、DeepSeek和豆包等平台的对话...
客观聊聊 MiniMax 的新模型
MiniMax M2.1模型在编程能力和UI设计方面展现出显著进步,其技术表现已接近国际前沿水平。该模型针对Rust、Go等后端语言进行了专项优化,提升了高并发场景下...
2025年AI盘点:15大名场面
2025年AI行业的发展呈现出前所未有的激烈竞争与戏剧性变化。DeepSeek-R1的发布成为开年标志性事件,其以不足600万美元的训练成本实现技术突破,直接冲击美股...





