图像生成

AI圈卷疯了！xAI、Anthropic同日上线API：Grok免费公测，Claude 3.5 Haiku价格暴涨

Anthropic公司宣布其最新的人工智能模型Claude 3.5 Haiku现已开放API访问，并在Anthropic的API、Amazon Bedrock和Google Cloud的Vertex AI上提供服务。该模型...

AIGC动态

1年前 (2024)

字节跳动和中国科学院的研究人员联合发布了超大多模态数据集InfiMM-WebMath-40B，旨在推动多模态大模型的发展。该数据集从Common-Crawl中筛选提炼而成，包含2...

AIGC动态

1年前 (2024)

15岁的CTO zmh开发的开源项目ChatNio被百万收购，该项目是一个集成多种流行模型和服务的一站式平台，包括OpenAI、Midjourney等。ChatNio功能全面，包括chatbo...

AIGC动态

1年前 (2024)

Meta与RayBan联名款智能眼镜RayBan Meta因其独特的功能和时尚外观在大陆市场受到关注。这款智能眼镜不仅支持语音交互，还配备了1200万像素高清摄像头，实现拍...

AIGC动态

1年前 (2024)

近期，网络上出现了关于o1图像理解功能的广泛讨论和测试。用户发现，通过选择ChatGPT 4o mini模型并上传图片，o1能够进行图像理解。这一功能原本是OpenAI未来...

AIGC动态

1年前 (2024)

近期，OpenAI的完整版o1模型意外泄露，允许用户直接体验其功能。泄露的模型展现出了强大的图像推理能力，能够处理上传的附件并进行多模态交互。在测试中，o1...

AIGC动态

1年前 (2024)

最近，一种新的测试基准在人工智能领域引起了广泛关注，即让大型AI模型参与“你画我猜”游戏。在这个游戏中，一个模型负责画画，其他模型则根据生成的内容猜测...

AIGC动态

1年前 (2024)

微软研究人员开发了一款名为OmniParser的开源视觉GUI智能体，旨在提升大语言模型（LLM）如GPT-4V在用户界面（UI）识别和操作任务中的表现。OmniParser通过将U...

AIGC动态

1年前 (2024)

初创公司Physical Intelligence（简称π）开发了一款名为π0的通用型机器人控制模型，该模型拥有3B参数，能够控制不同种类的机器人完成复杂任务，如叠衣服、整...

AIGC动态

1年前 (2024)

OpenAI的CEO奥特曼及其他四位高管在reddit的AMA活动中回应了公众对公司产品和AGI路线规划的疑问。他们透露，尽管不会命名为GPT-5，但年底将有重大更新。当前...

AIGC动态

1年前 (2024)