视障工程师帮助低视力人群扫除信息障碍

2021.06.22

全球至少有22亿人有不同程度的近视或远视问题。在大多数情况下,视力障碍可以通过辅助工具或治疗得到矫正,但对不少人来说,视障不仅影响他们的正常生活,也限制了他们的就业选择。在数字时代,信息世界的无障碍与现实世界的无障碍同等重要,因此一些工程师致力于为视障人群研发适合他们的应用程序。

25岁的周富贵是一名视障人士,也是深圳市信息无障碍研究会的软件开发工程师。每次打开电脑,他都需要把鼻尖贴近屏幕,再把字体放大五倍,才能用左眼仅存的视力看到屏幕上小小的英文代码。

包括富贵在内的许多视障工程师致力于通过技术促进信息无障碍。

富贵16岁时,入读了一家职业培训学校学习推拿康复。毕业后开始找工作时,他才发现视障人士想要在职场立足是多么困难。大部分企业都不了解视障员工的各种技能和他们的特定需求。

富贵坚信他能够为这个世界贡献更多价值,于是开始寻找推拿以外的工作。他从小就喜欢数学和逻辑推理,很快,他发现自己对信息技术,尤其是软件编程充满兴趣。

有一个多月的时间,他一直在网上观看和收听软件开发相关的视频。他将屏幕放大,暂停,仔细查看屏幕上的代码,然后花大量时间学习编程。

沉浸在代码的世界中,富贵脑海中闪现出一个新的想法:为视障人士开发一款应用,让他的朋友和其他视障人士能够像普通人一样用手机获取信息、享受娱乐。

像富贵这样的低视力人士往往无法阅读其他人习以为常的信息。他说:“超市里酱油和醋的瓶子很像,你必须要去看那些小字,才能分得清,但在没有工具的情况下要看清那些小字非常难。”

部分屏幕阅读器会为用户提供文字转语音以外的功能支持,例如,光学字符识别(OCR)是一种可以扫描屏幕上图像,并将其转换成可阅读的计算机文字的技术。这种技术可以进行图形界面识别、文字识别、坐标识别和纸质资料识别等。

大多数像富贵这样的普通开发者都无法自行开发这种技术。云计算供应商正在开发这些能力,并以应用编程接口(API)的形式让其他开发者可以直接调取使用,大大降低了应用开发的门槛。

OCR只提供基础能力,为充分理解视障人群的需求,开发人员还需要考虑应用程序所提供的整体交互体验。例如,界面上有很多信息,应该将哪些读出来?屏幕阅读器应该以哪种顺序阅读这些信息?面对这些问题,富贵开始深入研究信息无障碍领域的相关知识。

几个月之后,富贵将几种视障用户常用的功能加入一款可供用户听小说、查看天气和浏览视障人士论坛的应用程序,并将它命名为“掌中世界”,他的很多朋友已经在用它便利自己的生活。

富贵用手机应用程序收听信息。

“掌中世界”发布后,富贵在视障开发者当中开始小有名气。这款应用程序为他赢得了很多赞誉,也带来了很多其他机会和项目,大大丰富了他的开发经验和技术洞察。

2020年,富贵收到深圳市信息无障碍研究会的录取通知书,正式成为一名信息无障碍工程师。这次机会不但改变了他的生活轨迹,还让他以全新的方式为全球其他视障人士提供帮助。

运用技术为视障人群搭建“信息高速公路

2020年6月,腾讯云收到一封来自深圳市信息无障碍研究会的感谢信,感谢其为视障社群带来的信息和创造的无障碍环境。

半年前,腾讯云曾为身障开发群体提供OCR支持。现在,除富贵开发的“掌中世界”外,很多其他应用也具备OCR功能。OCR的请求总量已超过180万,目前服务的视障用户逾200万。

依靠这些技术开发上的进展,视障用户能够在网购时“看到”产品详情页中的文字内容。此外,他们还能识别出“按钮”、“验证码”和线上活动所需的其他信息。事实上,北京的一位视障父亲通过使用应用程序对电视屏幕拍照,了解节目表的顺序和内容后,成功为孩子播放《小猪佩奇》动画片。没有技术的助力,这些是难以实现的。

现在,富贵有一个更大的梦想。他希望先进的技术能够在更具体的场景中为视障人群带来更丰富、更细致的体验。例如,当一款应用描述一幅图片时,它能够描述出天空的样子、天空中云朵的飘移,以及湖水中荡起的涟漪。

随着各种互联网软件无障碍体验的不断提升,视障人士可以获得越来越多互联网的内容和信息,同时也拥有更多选择来实现他们的价值和潜能。

腾讯努力为开发者提供长久的支持,帮助人们突破自身限制,让所有人与互联网实现无障碍连接。