标签:多语言
Qwen3真香!通义App满血接入,一手实测在此
开源大模型Qwen3的发布引发了广泛关注,成为全球最强开源模型之一。该模型在多个领域展现出卓越性能,尤其是在编程、逻辑推理和多语言处理方面。Qwen3的参数...
阿里通义 Qwen3 上线 ,开源大军再添一名猛将
阿里新一代通义千问开源模型 Qwen3 于4月29日正式上线,用户可通过通义App和网页版体验其强大的智能能力。Qwen3 包含8款不同尺寸的模型,均为全新的“混合推理...
全球首款音乐推理模型Mureka O1首秀!爆改周杰伦,AI音乐进入DeepSeek时刻
昆仑万维发布了全球首款音乐推理大模型Mureka O1,标志着AI音乐进入了“会思考”的时代。该模型基于Mureka V6基座模型,并引入了CoT(Chain of Thought)技术,...
阿里开源多语言大模型,支持全球90%人口
阿里巴巴开源的多语言大模型Babel,旨在解决资源匮乏语言在人工智能领域中的不足。该模型支持25种主流语言,覆盖全球90%以上的人口,包括豪萨语、波斯语、印...
Cohere 发布多语言 Command A 模型:仅需两张 GPU 即可服务全球企业
加拿大AI初创公司Cohere发布了其最新生成式AI模型Command A,专为企业应用场景设计。该模型由transformer论文作者之一Aidan Gomez与多伦多大学校友Ivan Zhang...
语音模型平台Cartesia获6400万美元,只需3秒克隆语音
语音模型平台Cartesia宣布获得6400万美元A轮融资,由Kleiner Perkins领投。同时,Cartesia推出了最新语音模型Sonic 2.0和Sonic Turbo,其中Sonic 2.0的语音克...
Mistral AI 发布号称最强 OCR API:能解锁 90% 非结构化数据,1 美元搞定 2000 页文档
法国 AI 明星创企 Mistral AI 发布了一款名为 Mistral OCR 的光学字符识别(OCR)API,旨在帮助企业更高效地处理和理解各种文档。该 API 能够从非结构化的 PD...
千页只需7块钱,Mistral发布世界最强文件扫描API,实测仍有缺陷
法国大模型独角兽 Mistral AI 近期推出了其光学字符识别(OCR)产品 Mistral OCR,号称是“世界上最好的 OCR 模型”。该模型以图像和 PDF 作为输入,能够以前所...
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
MiniMax公司推出的海螺语音AI工具以其卓越的语音生成能力在市场中占据领先地位。该工具基于升级的T2A-01系列语音大模型,能够快速稳定地生成语音,具备音质清...
斯坦福AI科研神器开源,一键成文GPT-4o mini加持!科研写作彻底解放双手
斯坦福大学的研究团队最近推出了STORM和Co-STORM系统,这两个系统能够整合可靠信息并生成高质量的长篇文章。STORM系统通过多角度问答迭代式生成文章,而Co-ST...