圆海博客-探寻心灵的宁静

您现在的位置是:首页 > 博客 > 正文

博客

Gemini将更好地理解手机屏幕上的内容 包括网页、文件、视频

2024-05-15 11:50:02博客
Google正在更新Android的Gemini,以使其AI能够更好地了解屏幕上的内容。这次更新将使Gemini发挥出其最佳例之一,即在用户日常生活中帮助他们理解有限的数据。谷歌的Gemini在……

Google 正在更新 Android 的 Gemini,以使其 AI 能够更好地了解屏幕上的内容。这次更新将使 Gemini 发挥出其最佳例之一,即在用户日常生活中帮助他们理解有限的数据。

如果将 Gemini 设置为 Android 手机上的默认助手,它已经可以对网页或屏幕截图进行摘要或回答问题。不久之后,它还将能够别屏幕上是否有视频,并提示用户提问。Gemini 使用视频的自动字幕来寻找答案,这在以前的版本中经实现,只是需要绕一些弯路。

如果您正在查看 PDF 文件,Gemini 也会采取类似的操作,但有条件:您需要使用 Google 付费版本的 Gemini Advanced 才能使用该功能。这是因为该功能需要整个 PDF 作为上下文窗,这只在 Gemini Advanced 订阅者中可用。但一旦 Gemini 获得了 PDF 文件,您基本上就把它变成了该主题的专家 - 也许是您的洗碗机使用手册或当地的路边回收指南。Gemini Advanced 是每月20美元的 Google One AI 高级计划的一部分。

此外,还有一个小的更新:您很快就可以将 Gemini生成的图像拖放到正在使用的应用程序中,而无需在应用程序之间切换。您只需在 Gemini 叠加中长按图像,然后将其拖放到聊天或电子邮件中。总体而言,这使 Gemini 像是一个与系统其他部分无缝集成的东西,而不是您必须去获取的东西。

谷歌的 Gemini 在 Android 上的更新将在未来几个月内向 “数亿设备” 推出,并且还有更多上下文功能正在开发中。