大模型

杭州领跑AI开源！阿里Qwen除夕开源视觉理解新旗舰，全系列3尺寸，7B模型超GPT-4o-mini

阿里巴巴集团旗下的通义Qwen发布了新的视觉理解模型Qwen2.5-VL，这是一个开源的视觉语言模型，包含3B、7B和72B三个版本。Qwen2.5-VL-72B-Instruct在多个领域...

AI-Agent

1年前 (2025)

浙江大学和上海交通大学的研究团队提出了一种名为MergeNet的知识迁移框架，旨在解决边缘计算设备如智能物联网设备在部署深度神经网络时面临的计算资源和存储...

AIGC动态

1年前 (2025)

除夕夜，美股科技股遭遇历史性崩盘，英伟达股价暴跌17%，市值一夜蒸发近6000亿美元，创下单个公司史上最大市值损失纪录。DeepSeek的突破性AI模型以低成本、非...

AIGC动态

1年前 (2025)

中国初创公司DeepSeek近期引发全球科技股抛售，特别是对美国科技公司股价造成冲击，其中英伟达股价下跌近17%。DeepSeek在12月下旬推出了一个免费的开源大型语...

AIGC动态

1年前 (2025)

DeepSeek最近发布了新模型多模态Janus-Pro-7B，并立即开源。这一新模型在GenEval和DPG-Bench基准测试中超越了DALL-E 3和Stable Diffusion。Janus-Pro-7B基于D...

AI-Agent

1年前 (2025)

DeepSeek-R1是由中国公司深度求索开发的AI大模型，其背后的支持者为量化私募幻方基金。自2023年7月17日成立以来，深度求索陆续发布了多个AI大模型，包括DeepS...

AIGC动态

1年前 (2025)

DeepSeek在人工智能领域取得了重大突破，发布了开源多模态人工智能模型Janus-Pro，该模型包含10亿和70亿参数规模的版本。Janus-Pro-7B在GenEval和DPG-Bench基...

AIGC动态

1年前 (2025)

DeepSeek自20日发布以来，热度不减，其iOS应用甚至超越了ChatGPT官方应用，登顶AppStore。DeepSeek-R1迅速成为美国顶尖大学研究人员的首选模型，被认为可能是...

AIGC动态

1年前 (2025)

DeepSeek R1模型以其卓越的性能在AI领域引起了广泛关注。该模型在回答关于李世民在玄武门之变后的心理活动的问题时，展现了深入的历史背景理解、复杂的情感分...

AIGC动态

1年前 (2025)

在探讨如何使AI大模型在回答问题时既准确又丰富，并且观点鲜明有态度时，RAG（检索增强生成）技术被提出作为一种解决方案。RAG技术通过结合大模型能力和搜索...

AIGC动态

1年前 (2025)