大模型

LLM,VLM,模型

蜘蛛侠妖娆起舞,下一代ControlNet来了!贾佳亚团队推出,即插即用,还能控制视频生成

ControlNeXt是由香港中文大学贾佳亚团队推出的开源图像/视频生成引导工具,旨在成为下一代的ControlNet。它通过引入轻量化的条件控制模块,显著提高了可控生...

DeepSeek开源数学大模型,高中、大学定理证明新SOTA

数学家陶哲轩在牛津数学公开讲座中提出,人工智能(AI)与数学的结合将推动形式化证明的编写超越人类,这不仅将验证现有证明,还将创造新的数学知识。AI在形...

Anthropic API新增提示缓存功能:成本降低90%,延迟降低85%

Anthropic公司为其大模型平台API引入了一项新功能——提示缓存(Prompt Caching),旨在帮助开发者优化API调用的效率和成本。这一功能特别适用于需要处理大量上...

谷歌前CEO施密特说了些真话,但更暴露了这位施爷是个装糊涂的高手

谷歌前CEO埃里克·施密特在斯坦福大学的一次演讲中,无意间揭露了人工智能领域的一些真相,引起了广泛关注和讨论。施密特指出,开源虽然是一种正确的做法,但...

美国加州AI法案获通过,李飞飞、杨立昆、OpenAI坚决反对,六个关键问答解释一切|钛媒体AGI

美国加州的《前沿AI模型安全创新法案》(SB 1047)在经历重大修改后,已通过加州众议院拨款委员会的审核。该法案旨在防止大型AI系统造成重大人员伤亡或超过5...

知网状告秘塔AI搜索,称提供论文摘要涉嫌侵权,前者拥有全球最大的中文知识资源库|钛媒体AGI

国内AI创业公司上海秘塔网络科技有限公司(秘塔科技)近期收到知网的侵权警告,称秘塔科技未经许可,在AI搜索结果中展示学术文献的题目、目录和摘要,构成侵...

英伟达玩转剪枝、蒸馏:把Llama 3.1 8B参数减半,性能同尺寸更强

Meta公司推出的Llama 3.1系列模型,包括一个405B的超大型模型和两个较小的模型,虽然性能卓越,但对计算资源的需求巨大。为解决这一问题,业界开始关注小型语...

关于AI你最关心什么?技术专家团亲自答(含往期真人纯享版)

2022年底,OpenAI推出了大模型ChatGPT,引发了全球对大型人工智能模型的关注。2023年,谷歌、微软等全球科技巨头以及中国企业纷纷推出了自己的大模型,加速了...

独家 | 银河通用机器人最新一轮估值 4.25 亿美元

银河通用机器人公司在新一轮融资后估值达到4.25亿美元,此前已获得香港投资管理有限公司等多家投资方的超7亿人民币天使轮融资。公司成立一年便推出了具有全向...

10人明星团队炼出首个微调Llama 3.1 405B!角色扮演一秒入戏,代码全开源

开源模型Llama 3.1的405B版本经过Nous Research的微调后,发布了名为Hermes 3的微调版本。Nous Research是一个小型但技术实力强大的初创公司,专注于开放模型...
1 362 363 364 365 366 374