人机交互:从过去到现在

2022-12-03 11:08:08 浏览数 (2)

作为一个老码农,从上世纪80年代接触计算机以来,流行的计算方式都是通过现代 WIMP (窗口、图标、鼠标、指针)界面实现的,这种界面使得普通人可以使用计算机。随着计算机的发展,人机交互的作用一直在增加。大多数软件是交互式的,与界面相关的代码大约会占所有代码的一半以上。人机交互在应用程序设计中也扮演着重要的角色。

在消费者市场,产品的成功取决于每个用户的使用体验。不幸的是,在后端的伟大工程可能会被一个糟糕的交互界面搞砸,而一个好的用户界面可以承载住一个产品,用户可能会包容其内部存在弱点。

更重要的是,将“交互界面”与产品的其余部分分开并不是一个好主意,因为客户将产品视为一个系统。“从交互界面入手”的设计是当今的主要方式。因此,人机交互已经扩展到“以用户为中心的设计”,包括从需求分析、概念开发、原型设计、设计演进到产品发布后的支持和现场评估的诸多流程,但并不是说人机交互吞并了所有的软件工程。以用户为中心的设计方法,包括情境查询、人类学、用户行为的定性和定量评估等等,这与其他计算机工程方法有很大不同。因此,让具备这些技能的人参与到产品开发的各个阶段是非常重要的。

在当今的商业市场中,易用性仍然可能是 IT 增长和成功的障碍,这无疑是智能终端、医疗设备、汽车界面等领域面临的主要挑战之一。

过去的曾经

人机交互的许多核心思想都可以追溯到1945年Vannevar Bush的论文(“ As We May Think”),J.C.R.Licklider 在上世纪60年代对网络 IT 的设想,以及1968年12月计算机会议上Douglas Engelbart的在线系统演示。而现代人机交互的孵化器,一般公认为是施乐的Xerox PARC。

1970年,当时有一些小型计算机(例如 PDP11) ,是为工程师和科学家准备的,把计算机送给普通人使用还被认为是一个疯狂的想法。Alan Kay和施乐研发中心的工程师则致力于这一想法的研发,不久之后就研究出了 Smalltalk-72,在1973年生产了施乐 Alto 台式电脑。Alto 有一个鼠标、网卡和一个可重叠窗口的显示器。这是一个技术奇迹,但并不易用,主要是一个“面向文本”的机器,还缺少一个杀手级应用。虽然 Alto 是为普通用户开发的,但当时还不清楚这个市场到底是什么样子的,大多数 Altos 似乎已被出售或赠送给工程实验室。

1976年,施乐公司的Don Massaro提出了一个办公环境下的个人电脑概念,名为Star。Star被称为第一台“现代”WIMP 计算机。然而,Star 最引人注目的方面是其设计人员用于开发它的过程,这一过程已被广泛模仿,并使得良好的界面设计成为一个可重复的过程。它包括任务分析、情境开发、快速成型和用户的概念模型。大部分的设计演变都发生在编写代码之前。代码开发本身由许多小步骤组成,需要频繁的用户测试。这是一个教科书式的例子。

其他的原因导致了Star在市场上失败了,但这些方法在苹果的Macintosh电脑上获得了巨大的成功。因此,大众市场设计需要一个以用户为中心的设计过程,这涉及到真正的社会科学家或可用性专家,以及工程师。当设计新的东西时,复制能找到的每一个著名的惯例要比创造一个新的惯例要好得多。好的人机交互设计是进化的,而不是革命性的。

现代算机需要两种创新: 随心所欲、视觉驱动的工程,通常以技术为中心,但理想情况下以人类的行为原则为基础(Alto) ; 谨慎的、环境驱动的、以人为中心的设计进化。创新也需要验证,在人机交互中,验证意味着它能够很好地与真正的用户一起工作。

现在的目前

以用户为中心的设计运行良好,人机交互则是一门扎实的学科。随着信息技术的发展,人机交互已经无处不在了。所有的PC,几乎都运行着WIMP 接口。对于智能手机而言,windows mobile大胆尝试从 WIMP 接口的基础上进化出新的 WIMP,但它在市场上的表现非常惨淡。智能手机的市场是一个与办公情境完全不同的环境。

智能手机没有鼠标,有着麦克风和扬声器,可能还有摄像头和蓝牙,具有从粗信号塔到高精度辅助卫星 GPS 的各种位置信息。这些都是“情境”信息,与可能在键盘上输入或在屏幕上看到的“文本”形成了对比。通常,WIMP 完全依赖于输入的文本(包括鼠标输入)来确定要做什么。情境感知则使用它们能够使用的一切。这对于移动终端来说尤其重要。当用户在不同的地方,手机可以利用其他的情境感知来决定提供什么样的服务,或者它可以等待用户的请求。

系统的“智能”建立源于对其他用户行为的理解,对自己行为历史和偏好的理解,以及包括时间、地点、天气、蓝牙邻居等直接情境的了解之上。这三个部分代表了用户使用情境的三个基本方面:

  • 即时情境;
  • 活动情境,基于特定用户和其他用户行为的长短历史,许多活动是密切相关的;
  • 以及情境情境,基于其他参与者在那种情况下的典型行为。

情境感知是市场营销的梦想,可以触发一个积极主动的服务,如果执行得当,对消费者和广告商来说都是一个福音。情境感知的技术挑战是感知深度的任意性,其中许多不属于传统的人机交互领域。它们跨越了 Web 2.0/3.0的业务范围: 丰富的用户历史; 高度个性化的服务; 精心定向的营销; 以及社交和个人服务。在深入理解用户的行为和需求,以及使用这些服务的情境基础上构建这些系统是绝对必要的,这也是人机交互方法的用武之地。它还深入挖掘人工智能(用于用户和社会建模和预测) ; 系统工程(构建和部署服务) ; 心理学、经济学和其他社会科学(用于理解理性和非理性的用户行为) ; 以及非常广义的安全概念。

情境感知的重要用例包括语音识别,或者更准确地说是基于语音的接口,以及计算机视觉。例如,智能手机不仅是优秀的语音平台,而且能够使用计算机视觉,例如条形码识别和OCR。谈到 ASR (自动语音识别)和 VUI (语音用户界面) ,当 PC 主要用于办公时,VUI 没有多大意义。文本在日常商务交流中有着重要优势: 用户可以浏览想要的文本,如果不理解,可以反复阅读,可以在写作时编辑文本,可以通过大量读者转发文本而不失去原有的意义。书面文本通常没有口语中模棱两可,许多知识工作是关于管理结构化或半结构化的信息,并且具有精确性和鲁棒性。语音技术当然可以发挥一定的作用,但是在办公环境中取代“文本”的想法是不切实际的。显然,人机交互中 ASR 部分的识别准确性并不是限制因素,而是整个 VUI 设计的质量和应用程序与情境的匹配。

这带来了现实中最大的挑战,在研究人机交互、语音识别和计算机视觉之间需要架起一座桥梁。

人机交互中隐私的只言片语

感知界面意味着摄像头、麦克风和其他捕捉用户行为的传感器。情境感知意味着对数据进行高层次的解释,通常是在远离数据捕获的空间和时间上,这些都是隐私相关的热门话题。

在隐私计算中,用户数据在计算过程中受到加密保护,只有最终结果才会显示出来。例如,通过在用户之间的电子邮件中发现相似的关键词,可以推断出某种活动的重叠。通常情况下,对完整的电子邮件文本进行模式匹配处理是非常具有侵入性的,但是模式匹配处理的结果本身通常是良性的。隐私计算使我们能够确定最终结果而不会暴露任何有关用于执行模式匹配的数据信息。由于各种原因,隐私计算非常具有挑战性,其中一个重要原因就是计算成本高 ,但是随着技术的发展,隐私计算已经到达了可用的水平。隐私计算比匿名化提供了更强的隐私保护,需要一些相当新奇的技术例如零知识证明等。

事实上,普适计算环境中的隐私一直是一个主要关注点,解决这个问题的方法多种多样: 为用户提供更好的征询和同意界面、匿名化和各种形式的混淆。

一句话小结

随着移动计算设备和各种传感器变得无处不在,用于应用程序和服务的新资源正在向设计人员和开发人员开放,情境感知和隐私计算为人机交互的发展和演进提供了助力和约束。

0 人点赞