大模型
LLM,VLM,模型
杭州领跑AI开源!阿里Qwen除夕开源视觉理解新旗舰,全系列3尺寸,7B模型超GPT-4o-mini
阿里巴巴集团旗下的通义Qwen发布了新的视觉理解模型Qwen2.5-VL,这是一个开源的视觉语言模型,包含3B、7B和72B三个版本。Qwen2.5-VL-72B-Instruct在多个领域...
模型参数作知识通用载体,MergeNet离真正的异构知识迁移更进一步
浙江大学和上海交通大学的研究团队提出了一种名为MergeNet的知识迁移框架,旨在解决边缘计算设备如智能物联网设备在部署深度神经网络时面临的计算资源和存储...
DeepSeek重创美国芯片产业,英伟达一夜蒸发6000亿!巨头破防,美股历史性崩盘
除夕夜,美股科技股遭遇历史性崩盘,英伟达股价暴跌17%,市值一夜蒸发近6000亿美元,创下单个公司史上最大市值损失纪录。DeepSeek的突破性AI模型以低成本、非...
DeepSeek引发AI革命,英伟达市值暴跌
中国初创公司DeepSeek近期引发全球科技股抛售,特别是对美国科技公司股价造成冲击,其中英伟达股价下跌近17%。DeepSeek在12月下旬推出了一个免费的开源大型语...
滚烫Deepseek一夜刀掉英伟达4万亿,除夕开源多模态新模型:7B超越DALL-E 3和StableDiffusion
DeepSeek最近发布了新模型多模态Janus-Pro-7B,并立即开源。这一新模型在GenEval和DPG-Bench基准测试中超越了DALL-E 3和Stable Diffusion。Janus-Pro-7B基于D...
DeepSeek的提示词技巧,就是没有技巧。
DeepSeek-R1是由中国公司深度求索开发的AI大模型,其背后的支持者为量化私募幻方基金。自2023年7月17日成立以来,深度求索陆续发布了多个AI大模型,包括DeepS...
突发!DeepSeek除夕搞炸裂,开源多模态AI模型发布,仅128颗英伟达A100训练1周,性能碾压美国企业|钛媒体AGI
DeepSeek在人工智能领域取得了重大突破,发布了开源多模态人工智能模型Janus-Pro,该模型包含10亿和70亿参数规模的版本。Janus-Pro-7B在GenEval和DPG-Bench基...
创造历史!DeepSeek超越ChatGPT登顶中美AppStore
DeepSeek自20日发布以来,热度不减,其iOS应用甚至超越了ChatGPT官方应用,登顶AppStore。DeepSeek-R1迅速成为美国顶尖大学研究人员的首选模型,被认为可能是...
变天!——由一个惊艳例子引发对 DeepSeek 的 10 条思考
DeepSeek R1模型以其卓越的性能在AI领域引起了广泛关注。该模型在回答关于李世民在玄武门之变后的心理活动的问题时,展现了深入的历史背景理解、复杂的情感分...
只是RAG了一下,我看到了AI大模型的态度!
在探讨如何使AI大模型在回答问题时既准确又丰富,并且观点鲜明有态度时,RAG(检索增强生成)技术被提出作为一种解决方案。RAG技术通过结合大模型能力和搜索...




