Meta 眼镜支持多模态 Llama 3，实时翻译、物体识别，AI 眼镜的机会来了！

AIGC动态2年前 (2024)发布 Founder Park

3,422 0 0

Meta 眼镜支持多模态 Llama 3，实时翻译、物体识别，AI 眼镜的机会来了！

文章摘要

Meta官方宣布，其智能眼镜产品现已支持多模态版的Llama 3，这一功能在开源版本中尚未实现。这款眼镜具备音乐播放、语言翻译、发送语音信息等功能，能够在用户行走时提供信息服务，如对建筑物的介绍、视频电话和直播等。目前，这一新功能已在美国和加拿大地区销售的眼镜上推出，预示着多模态AI加持的Meta眼镜可能成为今年最受欢迎的AI硬件。

文章还提到了办公软件的AI化趋势，不同的产品采用了不同的AI集成方式，如WPS AI、Notion AI、Microsoft 365 Copilot以及商汤小浣熊等。这些产品面临的挑战包括处理大规模数据的能力、数据结果的精准性和可控性以及识别问题数据的能力。Tipis AI通过编写代码的方式处理数据，不仅解决了这些问题，还实现了AI的商业落地。

智能眼镜的核心功能之一是AI驱动的识物能力。它配备了1200万像素摄像头和五个麦克风，可以通过语音命令识别用户看到的物体。例如，用户可以询问眼镜关于食材的食谱，或者在选择衣物时获取建议。此外，实时翻译功能被认为是AR眼镜的杀手级应用，它可以在旅行时提供实时的语言翻译服务。

外媒The Verge对Meta智能眼镜进行了评测，发现尽管它在某些情况下能够准确识别物体，但有时也会出现错误。例如，在识别汽车和植物品种时，眼镜的回答并不总是准确的。评测指出，智能眼镜缺少变焦功能可能是导致错误识别的原因之一。

除了识物能力，智能眼镜还集成了多种新功能，如与Apple Music的连接，允许用户无需动手即可播放音乐。同时，它还支持通过WhatsApp和Messenger进行免提视频通话。新款式的眼镜框架也在更新中发布，提供了多种时尚选择，并且可以配合处方镜片使用。

总结来说，Meta的智能眼镜通过整合多模态AI技术，提供了一系列创新的功能，从而增强了用户体验。尽管在实际应用中可能存在一些局限性，但它的出现无疑推动了智能穿戴设备和办公软件AI化的发展。随着技术的不断进步和优化，未来的智能眼镜有望在更多场景中发挥其潜力。