住机遇的关键所在。
于是,这三大变化就成了笔者与戴老师第三次对话的主要话题。
记者:这次听您演讲,感觉您的研究更上一层楼。世界软件业的发展似乎碰到了一些问题,您认为中国软件业的发展面临难得的历史机遇。这一结论的依据是什么?
戴老师:我们先从世界主要软件厂商如微软公司、Oracle公司面临的问题谈起。应当承认,这些世界一流的软件企业有很强的实力,它们有充足的资金以及人力开发市场需要的新一代软件。但是,我们也应当看到,这些企业实际背着很重的包袱,因为它们要不断提高营收额,确保利润最大化,所以在决定未来开发方向时必然犹豫不决,难以做出正确的决策。
大家都知道,信息技术的发展经历了主机时代和PC(个人电脑)时代,正在进入普适计算时代。在个人电脑时代,企业的两大主流应用软件是Office和ERP,Office软件的核心功能是字处理和表处理,ERP则是对企业资源进行定量管理。现在看来,这两大主流软件对提高企业效益所能起的作用非常有限。因为现代企业已经成为一个复杂的巨系统。你曾经采访过的叶祖尧先生前两年出了一本书“TheArtofBusiness”(中文译名“商道”),把孙子兵法的5个字“道、天、地、将、法”应用于现代企业管理,他的观点引起许多世界级大企业高管的重视。所以,普适计算时代的主流企业应用软件不会停留在现在Office、ERP的水平,必须解决现代企业管理面临的关键问题。
从我国的情况看,我国软件业虽然实力不强,但是也没有沉重的负担;与欧美国家相比,我国政府的组织能力比较强。如果我们能够在发达国家主要软件厂商迷失方向的历史关头,抓住历史机遇,研发普适计算时代的主流应用软件,就可能一举摆脱软件业受制于人的被动局面。
记者:1997年我采访叶祖尧,他讲的一句话记忆犹新:开发软件一定要看5年以后市场上会流行什么。您刚才说的与叶先生所言是一致的。可是我们如何才能抓住历史机遇呢?
戴老师:我认为,新一代人机交互技术的研发,是开发下一代主流应用的关键所在。人机交互技术的发展从主机时代到PC时代,先后经历了批处理、命令行、图形界面三个阶段。在计算机从大型机到PC机的进化过程中,以图形化界面、直接操作、鼠标为代表的人机交互技术不断发展和成熟,对PC机的进化起到了第一推动力的作用。到目前为止,图形用户界面仍然是占统治地位的一类界面。这种基于桌面隐喻、使用视窗、图标、菜单、指针(英文缩写WIMP)范式的界面之所以能够成为近二十年中占统治地位的界面,是因为它具有对象可视化,语法极小化和快速语义反馈等非常明显的优点。
但是,随着数字终端设备多样化,如手机、PDA(掌上电脑)等等终端设备在中国这样的人口大国迅速普及,表明普适计算时代已经来临。WIMP界面范式的缺点已经暴露无遗。从技术层面看,WIMP界面以“桌面”为隐喻,制约了人机交互;计算机的输入/输出带宽不平衡;WIMP界面采用顺序的对话模式,仅支持精确和离散的输入,不能处理同步操作,不能利用人的听觉和触觉;WIMP界面无法适应普适计算。从用户角度看,用笔操作手机、PDA一类的终端设备能够手眼一致,远比用键盘鼠标方便,所以国内白领率先用笔操作手机、PDA,这就是回归自然。
正因如此,国外学者在20世纪90年代先后提出了非WIMP界面及后WIMP界面。在我国,中科院软件所在人机交互研究方面取得了重要成果。通过计算机和认知心理学的交叉研究,提出了eGOMS模型。该模型模拟用户在新的环境中整合多通道信息、通过系列操作完成期望目标的过程,指出交互是否有效主要体现在交互的自然性、直接性和操作速度上。在笔式用户界面及其应用方面,遵循回归汉字文明和回归自然,进行新界面软件研究和开发,提出了由物理对象、图标、按钮、手势(英文缩写PIBG)构成的笔式用户界面范式,其中P、IB、G分别与WIMP范式的W、IM、P相对应。PIBG范式以纸笔为隐喻,并没有在各个方面完全替代WIMP范式,它保留了图标、按钮等直接操纵组件,但从信息呈现和交互方式两个最为主要的方面有了根本性的改变。
记者:您的归纳很精练。我相信我们的读者能理解新一代人机交互技术的重要性。但是您强调笔式界面,这是为什么?新一代人机界面是否也可以是语音界面?
戴老师:这个问题很重要。这实际上涉及我们如何认识纸笔,换一句话说我们应当如何认识计算机。
人类使用纸笔已经有数千年的历史,人们用笔在纸上写文章,画画,也可以做各种计算,从这个角度看,笔是数据输入设备,纸是显示及数据存储、处理及输出设备。
反过来问:计算机到底是什么?实际上现在计算机做的许多事情与过去人们用纸笔做的是一样的,只是与纸笔比较,基于计算机的数字技术处理数据具有占用空间小、处理时间短,有利于信息安全,能实现不失真的复制、远距离传输,便于检索和导航(超链接)等等优点。所以我们说,纸是符号社会的窗口,而计算机显示屏是信息社会的窗口。
我们应当看到一个事实,计算机的普遍应用并没有减少纸张的使用。所谓无纸化办公实际只是神话。电子邮件的使用导致纸张消耗量增加40%。世界资源研究所公布的数字表明,加拿大人均年消耗纸张250公斤,美国人均每年消耗纸张333公斤,即7万张纸,每天接近200张。国际货币组织发表的内部情况是,人人拥有数字设备,但85%%的工作用纸张完成。
另一个事实是,迄今为止,基于纸张、电影胶片及录像带的模拟数据数量高达30万PB(1PB=100万GB,GB即千兆字节),远高于数字化数据的数量(约2万PB)。
所以人类要通过信息技术普及实现无纸化是不可能的。我们再来看笔。虽然我们已经用计算机写文章,但是笔的应用仍然无处不在。开会时我们用笔记录,或是用笔在白板(或是黑板、电子白板)书写;移动时用笔操作手机、PDA;思考时用笔书写、勾画;更不用说用笔写字作画,进行艺术创作。如果说无纸化是神话,那么人类更不可能摆脱笔。
再反过来提一个问题,为什么计算机就不能具备纸笔的优点呢?从普通纸笔到计算机,再发展到纸笔计算机,就是具备信息输入、存储、计算、输出功能的新型数字化纸笔,这实际上就是一个人机界面回归自然,回归大众,回归汉字文明的过程。这样的产品实际上已经有了,例如微软公司推出的TabletPC,瑞典一家公司推出的Anoto智能笔。
语音界面在技术上还存在障碍。人机语音交互大约要到2040年以后才能真正实现。
记者:您提到的这两种产品TabletPC、Anoto智能笔在市场上并不成功。
戴老师:是的。不过我们更应当分析这两种产品为什么在市场不成功。以TabletPC为例,实际上微软公司没有能重复Windows的成功经验。当年Windows3.0是靠Office的字处理、表处理应用获得市场成功,而TabletPC没有主流应用,当然无法取得市场成功。键盘鼠标是西方文化的产物,微软公司的研发人员大多是使用键盘鼠标的,要他们开发笔式界面主流应用当然勉为其难。
在中国情况就不同。我国个人电脑人均占有率还很低,手机的普及速度却非常快。进入普适计算时代,数字终端设备的多样化、小型化是必然趋势,计算机从柜台内走向柜台外也是必然趋势。随着我国数字终端设备用户数量的迅速增加,中国将成为世界信息技术主流市场之一。中国人用纸笔的历史悠久,笔式人机界面回归自然,回归大众,回归汉字文明,能够大大提高人机操作效率,必将受到用户欢迎。我预言,10年以后,中国将有50%%的用户用笔操作计算机。面对如此庞大的市场,开发笔式界面主流应用的任务就历史地落在我们身上。
记者:开发笔式界面主流软件应用需要哪些关键技术?软件所目前的研究达到什么水平?
戴老师:关于笔式用户界面的研究大体有两条道路。第一条路是利用模式识别的方法将笔作为文字输入的手段,或将笔作为鼠标的一种替代品。对于笔的应用还停留在鼠标的层次上,界面形态还停留在传统的WIMP形式上。因此这些研究成果无法从根本上解决目前大众使用计算机的难题。
我们的研究走的是第二条路。就是上升到笔式界面软件的高度,在理论,方法和应用三个层次进行研究,形成笔式界面软件开发的理论基础、开发方法和支撑环境,并针对不同的应用领域进行笔式界面软件的设计和开发。只有这样,才能将自然、和谐和高效的笔式交流方式深入到人们的日常生活中,实现人机环境中汉字文明的回归和飞跃。
具体工作分成四个主要阶段:第一阶段研究笔式界面软件的开发方法,第二阶段研究笔式界面软件的开发环境,第三阶段研究笔式界面软件中的核心算法,第四阶段构造笔式个人信息管理系统和笔式自由办公平台套件。
说到关键技术,我着重介绍相关核心算法及PIBG界面范式。
笔式界面软件中的核心算法主要有Ink(数字墨水)理解算法,手势识别算法,数学公式识别算法等。这里以Ink理解算法为例,这一算法包括呈现、处理、信息单元提取,整理和识别等。能够生成铅笔、钢笔和毛笔三种笔锋风格。实现笔迹的除噪和光顺。实现信息单元的图文分离,文字笔迹的字、行的提取。实现图形笔迹的分类、拟合等。顺便提一句,如果我们自主知识产权中央处理器(CPU)能够在指令集中集成Ink指令,就能进一步提高笔式界面软件的效率。
PIBG范式采用纸笔隐喻,模拟人们数千年来形成并熟悉的纸笔交互环境来构造界面的呈现方式。在WIMP界面范式下,鼠标是一种手眼分离的设备,用户必须在注视屏幕上光标运动的同时判断处于视线范围之外的鼠标运动。这种视线和动作的分离造成用户需要更多注意力去协调两者的关系。而在笔的交互方式下,用户手眼一致,大大地减轻了认知负担。从运动形式上来说,操作鼠标主要运用小臂和腕部肌肉,运动幅度较大,而且鼠标重量大,稳定性好,因此做直线运动快速准确,适合菜单的选择和点击。笔的操作主要靠手指和手腕运动,运动幅度一般较小,并且由于笔轻巧,适合小范围的曲线运动,因此用笔可以轻易地进行勾画,完成各种手势动作。对于鼠标来说,这些勾画动作都是不可想象的。PIBG范式正是利用了笔的这种优势,设计出一种不同于菜单模式、基于手势的交互方式。
我们对PIBG范式的自然性及易用性进行了评估。一方面,我们对系统的操作步骤进行分解,据此来考察在PIBG范式下的操作步骤是否更简单。另一方面,我们组织了多名使用者对笔式电子教学系统进行操作,通过观察他们完成任务的情况,来评估PIBG系统的效率。我们从界面呈现方式、手势的效率、用户满意度三个方面对PIBG模式的自然性进行评价。从结果得出,在这些任务的界面呈现中,PIBG通过强调图标和按钮,摒弃菜单的层次操作模式,从而减少了用户的操作步骤,提高了任务操作效率。从用户实际使用的情况来看,PIBG模式下所需要的时间也远远少于菜单模式。对于删除、移动、复制三种任务,不管是在对框的操作还是对文字的操作,手势所用时间都小于菜单方式。83.3%的用户更偏好使用PIBG范式。我们分别询问用户对各种操作方式的偏好,发现在PIBG与WIMP效率接近的任务中,用户也偏好使用PIBG范式。这是由于PIBG范式更符合以往在纸笔环境下形成的交互习惯,因此即使在完成效率上PIBG与WIMP方式一样,用户也会觉得PIBG使用起来更为自然。
记者:从我上次采访您到现在,一个重要的变化就是您领导开发的笔式界面教学软件已经有用户群了。用户反馈怎么样?
戴老师:从中科和谐教学系统的应用情况看,中年以上的教师用得很好,因为笔式界面有利于他们开发个性化的教学课件。
中科和谐教学系统的应用是软件所与鸿合科技集团合作的结果,这一软件的推广应用也得到了北京、上海、深圳等地政府的大力支持。我个人非常看重软件所与企业的合作。这是笔式界面软件推广的必由之路。
记者:其实笔式界面有许多应用可以开发。例如书法练习软件,可以让孩子们学写字的过程变得更有趣,效率也大大提高。
戴老师:这件事我们已经在做。很快就会有相关产品问世。
实际上,我们构造了笔式界面软件开发平台:PIBGToolkit(PIBG工具包)。它是一个基于PIBG交互范式思想的笔式应用开发平台。开发者可以利用PIBGToolkit来轻松地构造笔式应用,也可以方便地构造各种笔式交互系统。同时,我们构造了笔式界面软件的设计和生成工具,该工具支持设计者通过可视化的界面设计和生成方式来实现笔式界面软件,进一步提高了软件开发的效率。
采访临近结束,戴老师仍是那么兴奋。我能理解他的兴奋。年逾花甲的戴老师是中国软件业发展的见证人。他的兴奋蕴含着对未来软件发展主脉的理解,对我国软件产业前景的期盼,面临中国软件产业机遇急盼大干一番的-以及对中国新一代软件人的信心。
< 1 > < 2 >
|