视频生成
视频,video
杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini
阿里巴巴集团旗下的通义Qwen发布了新的视觉理解模型Qwen2.5-VL,这是一个开源的视觉语言模型,包含3B、7B和72B三个版本。Qwen2.5-VL-72B-Instruct在多个领域...
滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion
DeepSeek最近发布了新模型多模态Janus-Pro-7B,并立即开源。这一新模型在GenEval和DPG-Bench基准测试中超越了DALL-E 3和Stable Diffusion。Janus-Pro-7B基于D...
只是RAG了一下,我看到了AI大模型的态度!
在探讨如何使AI大模型在回答问题时既准确又丰富,并且观点鲜明有态度时,RAG(检索增强生成)技术被提出作为一种解决方案。RAG技术通过结合大模型能力和搜索...
AI 2025!8大热门赛道开年前瞻,从AI眼镜到推理Scaling一网打尽
站在2025年的起点,AI科技领域的发展趋势呈现出多样化的特点,涉及产品和技术两大方面。在产品侧,人形机器人、AI眼镜、智能驾驶和AI陪伴成为热点。人形机器...
Video Depth Anything来了!字节开源首款10分钟级长视频深度估计模型,性能SOTA
字节跳动智能创作AR团队与豆包大模型团队联合开发的Video Depth Anything(VDA)模型,针对单目深度估计在视频领域的应用难题取得了突破。VDA基于Depth Anyth...
自由画布第一波实测,边玩边把DDL列表清空了
百度文库与百度网盘联合推出了一款名为“自由画布”的AI创作工具,旨在为用户提供一个全方位的创作空间,实现多模态内容创作的全流程多线程并行处理。自由画布...
英伟达 RTX 5090、5080 和 5070 Ti 最新基测:不支持 DLSS 的游戏将拥有更多 AI 能力
英伟达近期公布了GeForce RTX 5090、GeForce RTX 5080、GeForce RTX 5070 Ti和GeForce RTX 5070等新一代GPU的技术和功能细节。这些新GPU在性能基准测试中不仅...
贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行
贾佳亚团队与Adobe团队合作开发的GenProp(Generative Video Propagation)模型,展示了Text-to-Video模型作为世界模拟器的潜力,并对传统视觉任务进行了革新...
OpenAI首个智能体Operator大测评,你也能拥有24小时私人管家!
OpenAI最新发布的AI智能体Operator能够自动处理一系列日常任务,如演唱会购票、家政服务预订和AI新闻查找等。Operator通过合作伙伴网站执行任务,例如通过Stu...
英伟达,又挖了一道护城河
AI技术的发展热潮仍在持续,微软和台积电等公司在AI领域的投资和利润增长表明了这一点。预计到2029年,全球GPU市场规模将增长至2700亿美元,HBM市场到2030年...