大模型也能“看懂”屏幕信息
  • 来源:科普时报
  • 作者:
  • 2025-04-02 09:41

近日,谷歌正式推出 Gemini Live 新功能,让旗下智能体Project Astra与Gemini Live的整合得以兑现。这些新功能不仅能让用户共享手机屏幕,还能通过智能手机的摄像头进行实时视频互动,这对于提升人工智能助手的使用体验无疑是一次重大飞跃。

不仅如此,Gemini Live还推出了实时视频解读功能,用户只需打开手机摄像头,Gemini大模型就能对所拍摄的画面进行解析并回答相关问题。也就是说,大模型Gemini就像长了一双“眼睛”,能实时查看用户屏幕内容,或者调用手机摄像头画面了。

点评:当大模型也能实时“读屏”和“观看”世界之时,AI与人类的交互必然更加“丝滑”,而由此带来的信息安全风险,也需要引起足够的重视。

编辑:吴桐
相关新闻

  • TEL:010-58884104
  • E-Mail:kepu@kepu.gov.cn
  • 如果您有任何意见或建议,请联系我们!