GPT-GPTs

GPT,GPTs,Prompt

AI医生终于有了硬标尺!全球首个专病循证评测框架GAPS发布,蚂蚁联合北大王俊院士团队出品

蚂蚁健康与北京大学人民医院王俊院士团队联合发布了全球首个专病循证能力评测框架GAPS(Grounding, Adequacy, Perturbation, Safety),旨在解决现有医疗AI评...

本周AI项目推荐:AI 还会诞生它的“今日头条”吗?

AI技术正在重塑新闻客户端的形态,多个新兴产品试图通过深度整合AI能力颠覆传统信息获取方式。尽管GPT技术引发了对新闻行业变革的期待,但受限于模型能力、成...

Agent「记吃不记打」?华为诺亚&港中文发布SCOPE:Prompt自我进化,让HLE成功率翻倍

在LLM Agent领域,一个普遍存在的问题是Agent无法从错误中有效学习,导致重复相同的错误。华为诺亚方舟实验室与香港中文大学联合发布的SCOPE框架,通过动态优...

别想休假!OpenAI圣诞放狠招,程序员假期变代码马拉松

OpenAI在圣诞季推出特别版Codex模型GPT-5.2-Codex-XMas,通过提升使用上限和重置速率限制,为开发者提供节日期间的编程便利。该模型功能与标准版一致,但增加...

我把这一年的AI聊天记录,让AI做人生总结后,我破防了。

在年末自我复盘的热潮中,一位深度依赖多款AI工具的用户尝试通过全年聊天记录完成独特的年终总结。 最初设想将ChatGPT、Gemini、DeepSeek和豆包等平台的对话...

客观聊聊 MiniMax 的新模型

MiniMax M2.1模型在编程能力和UI设计方面展现出显著进步,其技术表现已接近国际前沿水平。该模型针对Rust、Go等后端语言进行了专项优化,提升了高并发场景下...

2025年AI盘点:15大名场面

2025年AI行业的发展呈现出前所未有的激烈竞争与戏剧性变化。DeepSeek-R1的发布成为开年标志性事件,其以不足600万美元的训练成本实现技术突破,直接冲击美股...

无需再训练微调,一个辅助系统让GPT-5.2准确率飙到创纪录的75%

决定AI性能上限的关键因素正从底座模型转向外围的「推理编排」系统。最新研究显示,在大型语言模型(LLM)完全不变的情况下,仅通过优化推理编排系统就能显著...

游戏AI来了!英伟达新模型看直播学会所有游戏,GPT-5.2秒杀塞尔达

英伟达开发的NitroGen模型通过观看4万小时带有手柄画面的游戏直播,建立了从视觉输入到操作输出的直接映射。这一突破性方法摒弃了传统AI依赖游戏后台数据的模...

谷歌今年最成功的两款 AI 应用,都出自他手

Gemini模型及其相关应用在2023年表现出显著的增长势头。谷歌旗下的AI产品,如NotebookLM和Gemini App,用户数量大幅上升。NotebookLM移动端月活达到800万,而...
1 2 3 297