Firefox将利用人工智能提高浏览可访问性
似乎每一款现代软件都配备了人工智能,为客户提供质量、实用性和安全性都值得怀疑的功能。Mozilla 及其 Firefox 浏览器也未能幸免于人工智能的广泛使用,该公司希望实施人工智能以提高可访问性。
Tarek ZIade 在最近发表于 Mozilla Hacks 的一篇文章中解释了 Firefox 如何使用人工智能来提高可访问性,即为依赖辅助技术(如屏幕阅读器)的人们提供人工智能生成的图像字幕。
图片说明或“替代文本”为读者提供了必要的背景信息,但遗憾的是,许多作者忽略了替代文本,导致近一半的图片缺少适当的描述。借助最新的人工智能进步,现在可以运行本地机器学习模型来自动生成说明,而无需将潜在的敏感信息发送到服务器。
Firefox 130 将在 Nightly 频道中发布,其中包含一项 PDF 编辑器的新功能,该功能将使用小型开源 Tranormer 机器学习模型生成替代文本。Mozilla 声称他们擅长描述图像,且不会产生沉重的资源负担。因此,即使在性能较差的设备上,Firefox 用户也应该可以获得图像描述(PDF 中首次出现)。
根据博客文章,小型模型可以生成具有超过 2 亿个参数的替代文本,同时占用不到 200MB 的磁盘空间,并在几秒钟内提供输出。与最新的 GPT-4o 等现代 LLM 巨兽相比,它们的细节和准确性较低,但开发人员不想让用户被太多信息淹没。因此,Firefox 将专注于生成一句话的描述,例如:
使用本地模型有几个好处。除了隐私保护得到改善(图像不会去任何地方进行处理),用户还可以获得更好的资源效率、更高的透明度、更少的二氧化碳排放量(训练大型模型会产生大量碳排放),以及频繁更新和定期增强。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。