易鑫:架起人机信息交换的桥梁

2022-05-23 22:32刘玉杰
科学中国人·上半月 2022年3期
关键词:文本

刘玉杰

近年来,随着社会的进步、科技的发展,机器设备不断迭代更新并实现了与人类的交互。在人们可能访问的计算设备和数据的数量呈几何倍数增长的情况下,人机关系变得更加丰富多样。可以说,交互技术已成为终端和应用创新的核心竞争力。但普适计算时代下的人机交互仍存在诸多挑战,如用户心智模型的不可见性,传感器数据噪声,以及需要适应个体、环境的差异性等。

如何为用户与计算设备间自然高效的信息交换提供理论基础和优化方法,清华大学网络科学与网络空间研究院助理教授易鑫不断思索着……

兴趣动力和榜样力量

“帅气阳光,又红又专,德艺双馨,唱歌好听……对待科研工作很认真,原则性和规则意识很强……”这是某网站上网友对易鑫的评价。寥寥百字,他的形象跃然眼前。水木清华,钟灵毓秀。在美丽的清华园中,记者见到了他。作为一名青年学者,他有着年轻人特有的朝气与活力。从自身经历讲起,易鑫展开了话题……

2009年,易鑫以优异的成绩考上了清华大学的计算机科学与技术专业。在他入学后的第一门专业课——“计算机科学导论”的课堂上,易鑫见到了史元春教授,从此和她结下了不解之缘。在史教授的影响之下,他很早投入科研实践,开始了人机交互方面的研究工作。

难忘那段早年参与实践的时光,由于实验涉及的细节非常多,项目组经常熬夜加班,一起讨论、一起写代码。大四那年夏天,易鑫一直埋头在实验室里调程序,忙得连参加毕业聚会的时间都没有。现在回想起来,易鑫仍感激那段经历,“人机交互是一个交叉学科的领域,不光牵扯编程、算法等计算机方面的知识,还涉及社会学、心理学等学科的知识”。交叉学科的广泛涉猎,不仅满足了易鑫的好奇心,也为他构建了全面的知识架构体系。

不知不觉,易鑫已在史元春团队待了近十年。在这段时光里,让易鑫印象最深的便是史老师的认真严谨。围绕研究内容,她会带领项目组召开无数次会议,每次一讨论就是好几个小时。在研究过程中,史老师会对每一个细节都进行精准把握。即使是在材料编写时,哪怕只是一个小小的标点符号错误,她都会纠正过来。榜样的力量,牵引着易鑫步步前行。

2021年,易鑫顺利成为网络科学与网络空间研究院的一名助理教授。除了开展科研工作,他的任务还包括指导学生。“除了科研能力,学生的组织能力、表达能力等也很重要。我希望带领学生在快乐学习的同时能提高他们的综合能力,实现全面发展。而史老师就是我教书育人的榜样!”易鑫说。

解决“胖手指”问题

随着信息技术的发展,在传统物理键盘之外,触屏、虚拟现实等新型交互接口不断出现,在提高了交互自然性的同时,却显著降低了交互的性能。如何兼顾交互的自然性和高效性,成为人机交互研究中的难题。而“胖手指”问题就是其中的典型代表。在信息技术领域,“胖手指”這一术语专指由于手指本身的柔软,以及点击时对于屏幕显示内容的遮挡,在触屏上点击时往往难以精确控制落点位置的问题。

解决“胖手指”问题是易鑫投入科研以来聚焦的一项重要成果。“多年来,人机界面越来越强调交互的自然性,并随之出现了触摸交互界面,以及近年来的体感交互、虚拟现实等三维交互界面。”易鑫介绍道,但这些界面尺寸不一且普遍缺乏触觉反馈,导致用户动作中的噪声相对较大,难以进行交互意图的准确推理,从而限制了交互输入的准确度。此前,也有研究者尝试采用贝叶斯方法解决文本输入中兼顾交互的自然性和高效性这一难题,但往往仅考虑了落点位置信息,作用有限。在研究中,易鑫及团队面向多种输入接口,对点击模型精度优化(提升计算精度)、面向不确定性输入映射的计算方法扩展(扩展计算方法)和文本输入手部动作建模(扩充先验知识)等方面优化了文本输入的基本贝叶斯方法,相应的技术也大幅提高了自然文本输入的交互性能。

针对触屏软键盘这一文本输入接口上的“胖手指”难题,易鑫提出了触屏软键盘上精度优化的点击模型。实验结果证明,基于该精度优化的点击模型的贝叶斯方法能支持用户在宽度仅为3.5厘米的智能手表全键盘上达到与智能手机软键盘相当的、每分钟35个英文单词的输入速度和近100%的准确率。同时,点击模型的精度优化也能将手机软键盘的文本输入错误率降低23%。

空中文本输入对于后桌面时代交互(如虚拟现实、移动手机)是一个有潜力和被期待的交互需求。在这方面,虽然“十指盲打”是人们在日常生活中最高效和最习惯的输入方式,但基于该能力的空中裸手“十指盲打”技术研究,此前尚没有人取得很好的效果。在相关项目中,易鑫提出了一种使得空中裸手“十指盲打”成为可能的新型技术空中双手盲打键盘(ATK)。结果证明,ATK在输入速度和准确率方面都超过了已有的空中文本输入技术,第一次较好地实现了这一已经提出数十年的交互概念。

基于贝叶斯的智能文本输入技术,易鑫有效解决了移动终端、可穿戴设备等设备上的“胖手指”问题和输入界面受限问题,数倍提升了文本输入的效率、准确率与输入自然性,突破了学界“空中打字”的公开难题,提出了智能手表全键盘输入、智能平板盲式文本输入等一系列智能文本输入技术,并实际应用于搜狗输入法、华为智能手机等商业产品中。相关成果获得CHI 2017和CHI 2019的最佳论文提名奖。

开展人机系统中的应用安全研究

随着移动终端、可穿戴设备、物联网设备等轻量、便携、多功能的交互设备不断走进人们的生活,未来社会中的人、机、物关系逐渐超越了现在单一、固定的模式,呈现出越来越强的动态性、多样性特征。人、机、物已不再是相互独立的元素,而是共同构成了泛在互联的三元网络。“人不再仅仅是需求的发起方,而同时也是网络的组成部分。”易鑫解释说。

在人、机、物泛在互联的三元网络中,人与机通过人机交互技术进一步融合,依托面向自然交互的意图推理方法,人们可以摆脱刻意、专用的交互意图表达行为,通过自然的动作更快地触发信息服务,甚至可通过脑机接口等新型交互接口,实现“所想即所得”的极致交互体验。而为了实现这一能力,研究者需要将视野跳出用户周围的局部,以更广泛的“网络”思维来考虑人的行为和需求,以及来管理人和设备的能力。例如,将智能家居中不同的物联网设备构成的网络视为一个整体来满足人在不同房间中走动时的服务连续性;将人和机器人根据功能和位置进行分工和协作以完成复杂的检修任务……

为应对这些挑战,易鑫加入了清华大学网络科学与网络空间研究院,通过人机交互、人工智能、应用安全等学科交叉的方式,开展人机系统中的应用安全研究,以期在打通人机交互接口的基础上,进一步通过多人、多机,以及远程网络服务的融合,突破现有人机交互技术在动态、复杂场景下的可用性瓶颈。同时,通过提升交互接口信息鲁棒性和隐私性、改进交互技术安全性,实现人在无处不在的信息访问环境中的应用数据安全,从而为我国庞大的用户终端产业向下一代的普适计算进化提供有力的支撑。

“未来,人机交互的重点将放到减少用户操作方面,从以往被动接受用户操作指令,到主动感知用户操作需求。”易鑫说,利用人工智能技术可以将人类面部表情、语言、文字、肢体动作、生理信号等转化为情感数据,横亘在人脑与电脑之间的“情感”鸿沟正在被跨越。他说:“伴随着更为便捷、高效的人机交互方式的诞生,伴随着物联网、卫星互联网等新型网络形态的发展,计算机将会在生产、生活中为人类带来更多的福祉。”

(责编:黄雪霜)

猜你喜欢
文本
文本联读学概括 细致观察促写作
小学中段非连续性文本阅读教学初探
挖掘文本资源 有效落实语言实践
搭文本之桥 铺生活之路 引习作之流
文本与电影的照应阅读——以《〈草房子〉文本与影片的对比阅读》教学为例
“反”教语文 破解文本言语形式
基于文本互涉理论的阅读教学策略
细读文本—阅读理解的解锁姿势
基于SVM主动学习技术的PU文本分类
贫困村建档立卡工作示意图及参考文本