豆包方面表示,该质疑是对技术实现的错误解读。
豆包手机助手采用原生截屏接口(Window Manager Service.captureDisplay),严格遵循应用声明的Secure标记,无法截屏银行安全键盘等声明受保护的界面内容。
关于权限使用,文中解释称:READ_FRAME_BUFFER权限是为了获取虚拟屏中运行的应用截图供模型推理,无法读取Secure内容;CAPTURE_SECURE_VIDEO_OUTPUT权限仅用于将受保护内容在投影中正常展示给用户以便操作,受保护页面仍无法被截屏。
此外,豆包披露了运行原理:用户下达指令后,系统截屏上传至云端大模型分析(每步间隔约3秒),完成后执行操作。官方强调,截屏仅用于视觉理解和推理,任务完成后不会在云端存储。受限于芯片性能,目前国内多家手机厂商的AI助手产品均采用类似的云端处理原理及系统权限。
这种“截图上云”的模式,其实解答了外界对于AI如何“看懂”手机的疑惑。简单来说,就是把手机屏幕画面像发图片一样,每隔几秒传给云端的超级大脑,让大脑看懂后再指挥手机怎么点。
豆包在说明中坦言,受限于现在的手机芯片性能,还没法直接在手机本地跑通这么复杂的流程,所以这种由“远程大脑”代驾的模式,不仅是他们一家在用,也是目前行业里的通用做法。
至于外界最担心的“银行密码会不会被AI偷看”,这里涉及安卓系统底层的“红线”——Secure(安全)协议。虽然豆包为了实现自动操作,确实申请了较高的系统权限,但这并不意味着它能突破系统的底层防护。按照安卓的规则,只要银行或支付App开启了防截屏保护,AI截取到的画面就是一片漆黑,根本看不见键盘和密码。那些被质疑的特殊权限,实际上是为了让用户自己能看到画面并进行操作,而不是给AI开后门。
(新黄河客户端记者杜林)
留言区等你