图像生成
图像,绘画
李飞飞曝创业招人标准!总结AI 大牛学生经验,告诫博士们不要做堆算力项目
李飞飞,被誉为“AI教母”,近日以创业者身份接受了YC的采访,深入探讨了AI发展的瓶颈及其初创公司World Labs的目标。她指出,当前以语言大模型为代表的AI繁荣...
智源新出OmniGen2开源神器,一键解锁AI绘图「哆啦 A 梦」任意门
2024年9月,智源研究院发布了统一图像生成模型OmniGen,该模型在单一架构内支持多种图像生成任务,包括文本生成图像、图像编辑和主题驱动图像生成。用户仅需...
百度AI,终于对搜索下手了
百度和Google在AI搜索领域的策略有所不同。百度采取了渐进式变革,逐步用AI改造搜索,AI生成的搜索结果占比从10%逐步涨到35%,但大部分仍作为传统蓝色链接的...
干翻 GPT-4V 的面壁 8B「小钢炮」,被Nature 收录了
清华大学与面壁智能团队在边缘设备上成功实现了多模态大模型的落地,推出了MiniCPM-V系列模型,该系列包括MiniCPM-V 1.0、MiniCPM-V 2.0和MiniCPM-Llama3-V 2...
Altman嘲讽小扎挖走的都不是顶尖人才!OpenAI高管再营业曝内幕:ChatGPT爆红后,我火速升职了!
在AI领域竞争日益激烈的背景下,Meta和OpenAI之间的AI人才争夺战成为焦点。Meta首席执行官马克·扎克伯格近期宣布成立超级智能团队,并成功招募了多位OpenAI的...
我们用世界名画和Meme“拷打”了智谱9B的视觉推理模型,结果出人意料
2025年上半年,AI开源领域的竞争聚焦于效率提升、多模态能力和智能体开发三大方向。参数规模不再是唯一追求,如何通过架构创新和训练方法优化实现“小模型强性...
跟着Google出海:教你怎么落地Gemini
Founder Park 与 Google 合作推出的「从模型到行动」系列 AI 工作坊,旨在帮助开发者将顶尖 AI 模型的能力转化为实际商业价值。该系列工作坊将在深圳、上海和...
开源端到端语音大模型:直接从原始音频输入,生成语音输出
Step-Audio团队近期开源了一个端到端的语音大模型Step-Audio-AQAA,该模型能够直接理解音频输入并生成自然流畅的语音回答,而无需先将语音转换为文本。这一技...
95后,边改造业务边发AI顶会论文,是怎样的体验?
在AI时代的浪潮下,顶尖技术人才的市场价值被推升至前所未有的高度。无论是谷歌Transformer论文八子,还是从OpenAI出走的科学家,他们的选择直接影响企业技术...
文心大模型 4.5 系列正式开源,涵盖 10 余款模型
百度于6月30日正式开源了文心大模型4.5系列,涵盖10款不同参数规模的模型,包括47B、3B激活参数的混合专家(MoE)模型和0.3B参数的稠密型模型。这些模型已在...




