- 企业数智化转型之路:智能化数字平台建设及应用实践
- 杨明川等编著
- 9998字
- 2025-02-22 10:22:27
1.1 从数字化到数智化
当企业随着技术进步而采用创新方式来开展业务时,它们就是在实施“数字化”,这是一个使用数字化工具从根本上实现转变的过程。本节从主导数字化进程的关键企业和核心技术出发,引出了数字化和数智化的概念,提出了数智化是数字化的高级阶段的观点,进而论述了数智化转型的特性和发展趋势。
1.1.1 数字化的概念和发展历程
数字革命正在全球范围内推开,数字化已成为当前我国经济转向高质量发展阶段的核心关键词。根据高德纳(Gartner)咨询公司的定义,将模拟信息转换为数字形式就是数字化,数字化是利用数字技术来改变商业模式并提供新的创造收入和价值的机会。《中国产业数字化报告2020》中指出,“产业数字化”是指在新一代数字科技支撑和引领下,以数据为关键要素,以价值释放为核心,以数据赋能为主线,对产业链上下游的全要素进行数字化升级、转型和再造的过程。数字化发展对于企业、行业以及宏观经济都具有极其重要的意义。从微观看,数字化提升企业生产质量和效率;从中观看,数字化重塑产业分工协作;从宏观看,数字化加速经济新旧动能转换。
数字化是一个长期的、不断演变的过程。从20世纪80年代起,随着新兴技术的不断发展,数字化经历了从软件化到互联网化,到云化,再到智能化,继而到去中心化等阶段的更新迭代,在各个阶段中,数字化产业围绕着主导企业和核心技术两个方面不断演进,演进过程如图1-1所示。
1.软件化阶段
在软件化阶段,企业通过安装办公自动化(Office Automation,OA)、企业资源计划(Enterprise Resource Planning,ERP)、供应链管理(Supply Chain Management,SCM)、客户关系管理(Customer Relationship Management,CRM)等各类信息化软件,构建单点业务环节信息系统,全面优化企业的研发、生产、经营流程,提高管理效率,为进一步深入开展数字化转型打下坚实基础。该阶段的主导企业有微软、英特尔、IBM、Oracle、EMC等,它们通过掌握X86的CPU、PC操作系统、关系型数据库、软件开发语言核心技术,在软件化期间发展成为世界巨头。

图1-1 数字化产业演进过程
2.互联网化阶段
在互联网化阶段,商业发生了革命性的变化,商业系统进入了新时代——在线时代。伴随着4G、5G等移动互联网及物联网技术的迭代,电子商务、社交网络、移动支付、网约车等新业务纷纷涌现,推动消费者消费在线化,推动组织、管理、服务的在线化。该阶段诞生了一大批新锐公司,伴着互联网化的浪潮,它们乘风而起,迅猛发展,这其中就包括科技巨头谷歌、苹果、华为、BAT(百度、阿里、腾讯)、思科等,该阶段的核心技术有TCP/IP、Web、移动互联网、搜索引擎、移动操作系统、移动终端等。
3.云化阶段
在云化阶段,越来越多的企业通过云计算技术来实现企业的云化发展,用户的使用习惯也发生了改变,“计算机+软件”逐步演变为“云服务+数据”。云端需求的蓬勃发展不可避免地影响着企业的经营模式及行业的运营模式,把握住其中奥义的企业在云化阶段获得了跨越式的发展,该阶段巨头集中在AWS、微软、Google、阿里等,该阶段的核心技术包括虚拟化技术、云操作系统、大数据技术、容器技术、云原生技术等。
4.智能化阶段
在智能化阶段,以云计算、物联网、人工智能、5G、数字孪生等为代表的智能技术群落协同构建了新的商业基础设施,支撑各行各业向智能化转型,企业的“数智化”转型已成为必然趋势,智能化成为创造更多价值的破题之举,技术创新型企业无不把人工智能上升到企业战略的层面。
互联网化阶段和云化阶段的龙头企业大都随时代而动,开始了智能化转型,如谷歌的DeepMind,致力把人的智能和计算机的智能进一步融合;微软的Carina,力求实现统一化数据模型、智能化领域算法和多场景覆盖的智能化应用;英伟达,成功预测了新一波浪潮,生产还处于市场萌芽期的图形处理器,为AI领域的深度学习所广泛运用。该阶段的核心技术包括深度学习、人工智能训练必备硬件、数字孪生、知识图谱、数字大脑、智能机器人等。
纵观新兴技术的发展历程,软件化阶段依托各类信息化软件为数字化打下了坚实的基础,互联网化阶段以在线化为特征全面推动数字化进程,云化阶段借助企业上云将数字化推进到新的阶段,而智能化阶段是数字化发展的高级阶段,这个阶段的典型特征是以数据为生产要素,以智能算法为核心驱动力,也将这个阶段称为数智化阶段。数智化阶段是对数字化发展的革新,具有深刻的内涵。
1.1.2 数智化的概念及关键要素
数智化是数字化的高级阶段,在这个阶段,各种数字技术将进行充分融合,实现从量变到质变的飞跃。宏观上,数智化是通过新一代数字技术的深入运用,构建一个全感知、全连接、全场景、全智能的数字世界,进而优化再造物理世界的业务,对传统管理模式、业务模式、商业模式等进行创新和重塑。
对于企业而言,数智化让企业具有状态感知、实时分析、科学决策、精准执行的能力。数智化的本质是一种范式迁移。如图1-2所示,随着数字化的不断发展,企业提供服务的模式也在不断进化。互联网化的过程中企业遵循网络信息服务范式,网络和应用呈现松耦合的分离状态,内容和应用服务商占据主导地位,网络运营商被逐渐管道化。云化的过程中,企业遵循云服务范式,云通过按需服务的方式高效整合资源,并逐级向上提供服务,其服务模式是单向的,公有云仅仅提供基础的资源和能力,应用和能力脱节。在数智化阶段,将形成新的以“数据-算法-服务”为核心的闭环,将数据的价值充分发挥出来,并通过全局优化的算法最大限度提升服务的能力和水平,建立起差异化的竞争优势。

图1-2 以数据为核心的数智化闭环服务范式
这种数智化新范式,在诸多创新型企业中也得到了体现,如新兴技术企业特斯拉、老牌企业通用电气和国内的诸多互联网公司。这些创新型企业不是因为用户规模和能力规模而强大,而是借助海量用户数据通过算法提供高效服务而强大。
这些企业通过收集大规模数据,开发高质量算法,提供高效率服务,形成了以数据为核心的数智闭环发展范式。而未来行业的竞争将是“数据-算法-服务”这个新范式下的数字化核心能力的竞争,以三个要素为核心构成的“新发展范式”也将更容易从市场中脱颖而出,成为新的独角兽企业。
1.数据是数智化的基础,也是数智化的核心要素
“数据不是一切,但一切都在变成数据。”现今,数据已经不是传统意义上的数据,而是包括文字、照片、音频、视频在内的所有记录。信息管理专家、科技作家涂子沛在《数文明》一书中指出,传统意义上的数据是人类对事物进行测量的结果,是作为“量”而存在的数据;今天的照片、视频、音频不是源于测量而是源于对周围环境的记录,是作为一种证据、根据而存在的。从这个意义上讲,互联网技术的价值不仅在于连接,更在于通过记录形成沉淀数据的基础设施。
数据成为连接物理世界、信息世界和人类世界三元世界的重要纽带,也因此成为数智化的基础和核心要素。据多摩公司(DOMO)统计,2016年全球有34亿网民,而到2021年全球网民数量已增至52亿。2021年,全球每分钟有24万张图片通过Facebook分享,有28.3万美元交易在亚马逊上完成,有69.4万小时视频在YouTube上播放。据IDC(互联网数据中心)预测,2025年全球数据量将高达175ZB。其中,中国数据量增速最为迅猛,预计2025年将增至48.6ZB,占全球数据圈的27.8%,平均每年的增长速度比全球快3%,中国将成为全球最大的数据圈。
这些数字代表的不仅仅是一个单纯的数据量,更代表其背后巨大的产业价值。2020年4月10日,《中共中央国务院关于构建更加完善的要素市场化配置体制机制的意见》正式公布,首次明确数据成为新的生产要素之一。数据的力量,就如农耕之于古代文明,工业革命之于现代文明。商业领域已经发现了数据的价值,但数据能带来的价值远不止这些,它将带来全新的产业变革,甚至催生一种全新的文明形态。
2.算法作为数智化的要素之一,发挥着创新源泉的作用
数据描述了物理世界发生的事情,一旦结合了算法就能迸发出令人惊叹的创造力。算法专家凯文·斯拉文在TED演讲中指出:“算法来源于这个世界,提炼这个世界,现在塑造这个世界”。“数据+算法”构造了人们认识这个世界新的方法,是在数字世界中进行科学实验的另一种表现形式。DeepMind提出的AlphaFold人工智能系统可以准确预测人类蛋白质98.5%的氨基酸结构。而在AlphaFold问世之前,传统实验室只研究了17%的蛋白质结构。2001年诺贝尔生理学或医学奖得主Paul Nurse曾说,理解蛋白质的功能对于提高我们对生命的认识是至关重要的,AlphaFold是生物创新的一次巨大飞跃。
创新企业也通过“数据+算法”获得了竞争优势。特斯拉通过在全球销售的200万辆车,已收集了超过160亿千米的真实行驶数据。特斯拉通过这些数据开发的自动驾驶算法在全球领先。特斯拉车辆安全报告显示,2021年第四季度,特斯拉自动驾驶参与的驾驶活动,平均碰撞事故率为1起/690万千米(美国境内车辆平均碰撞事故率为1起/77.44万千米)。通用电气公司目前约有35000台发动机,一台发动机的数据包中包含480个飞行参数,这些发动机每年可以产生超过1亿次的飞行记录,相当于每天捕获超过100万TB的数据。2015年,飞行警告算法通过这些数据产生了约35万个警告信息,其中86%都是准确的。
互联网平台赢得巨大成功的武器也是“数据+算法”。人们在浏览网页、网上购物、翻看小视频、使用微信聊天,甚至驾驶汽车的过程中,无时不刻都在“贡献”自己的数据,平台利用这些数据通过行为分析算法可以刻画出一个“数字化的你”。
目前,算法对于数据的价值挖掘才刚刚开始,80%的非结构化数据还没有得到真正的应用。这些数据需要人工智能算法进一步去挖掘。为了充分利用数据价值,解决传统深度学习应用碎片化难题,探索通用人工智能,众多AI领域头部公司将视线放在了拥有超大规模参数的预训练模型上。基于Transformer架构,2018年底开始出现一大批预训练语言模型,刷新了众多NLP任务,形成新的里程碑事件,开启了基于大规模数据的预训练语言模型时代,这一时期模型的典型代表有GPT、ELMo、BERT和GNN等。2019年,基于基础预训练语言模型的改进模型喷涌而出,包括XLNet、RoBERTa、GPT-2、ERNIE、T5等,在参与规模、运行效率、运行速度、模型效果等方面全面超越原有模型。尤其是数据上面,每一代均比前一代有了数量级的飞跃,在语料的覆盖范围、丰富度上都有大规模的增长。到了2020年,预训练语言模型进一步发展,典型代表有GPT-3、ELECTRA和ALBERT。与此同时,也有越来越多的研究人员选择了大规模预训练模型作为基础,将这一思想应用于语音和图像等领域,对场景数据进行建模,发布了多种改良版本的“BERT”模型,进一步挖掘非结构化数据的潜力。预训练语言模型把自然语言处理带入了一个新的阶段,通过大数据预训练加小数据微调,进一步挖掘非结构化数据的潜力。
3.场景是数智化应用的目标,企业的数智化业务离不开场景的支撑
对企业来说,数字技术驱动业务发展才是核心目标,因此,与实际场景的深度融合是数智化的首要目标。企业家于英涛曾指出,在数字化时代,没有数据的场景是花架子,没有场景的数据是死数字,数据与场景一起相依相伴融合生长。数智化因场景而生,场景因数智化而立。在企业的数智化进程中,将各业务线中用户的痛点、难点、需求点场景化,既能满足用户需求,又能进行业务梳理并解决问题,同时帮助公司沉淀出新的智能化产品和服务,创造更多价值。
电信运营商行业中,无线网络优化是一项非常重要的业务,传统优化方式需要大量人工参与硬件检查、话务报表统计、现场测试及收集用户投诉情况等过程,并以此为基础采取相关的措施对无线网络进行调整。整个过程费时费力,业务运行效率低且很难追踪评价。通过无线网智慧运维系统的建设,基于业务场景需求结合大数据、人工智能等智能化技术进行业务建模,可以自动完成异常网元处理、异常网元清单查询、数据质量评估等工作,保证对多厂家、多版本的无线网数据质量检测、评估、派发工单及审核,大大提高了无线网运维效率,有效提升了网络质量。医疗领域中,问诊是医生的核心工作,人们往往倾向于前往较高级别的医院寻求专家帮助。但是由于时间、地域、医疗资源等限制,经常出现医生“一号难求”的场景。而通过医院数智化转型建设,构建智慧诊疗系统,辅助医生完成简单病情的初步筛查,辅助快速定位病情,可以减少医生问诊时间,从而节约时间帮助更多病人。同时可以开启线上问诊新模式,解决时间、地域不便带来的无法接受更好的医疗救治问题。治安工作中,人物关系分析是其业务的关键一环,通常的方式是采取人工走访+数据收集的方式,耗时耗力且具有一定危险性。通过对业务需求进行梳理并利用大数据、终端设备等方式采集数据,然后通过人工智能等技术手段基于治安多业务场景进行具体需求建模,可以有效对人员多维度海量非结构化数据进行分析挖掘,定位所需人员信息。治安场景下人物关系智能分析系统建设可以帮助挖掘多维度数据中隐含的潜在人员关系,减少人工成本的同时获取更加精准的情报信息。
通过电信领域、医疗领域、社会治理领域的典型应用场景可以看出,数智化在当今数字经济大背景下发挥着重要作用。场景是数智化应用的目标,根据场景找到需要的数据,利用数据在场景中发挥作用、产生价值,才能真正实现数智化应用。
1.1.3 数智化是数字化的全面升级
20世纪70~80年代,传统IT技术给企业带来了显著的效率提升和经济效益。20世纪80年代后期,商业世界的复杂性急剧上升,使得业务和管理的复杂性也随之上升,驱动数字技术不断升级和迁移。市场从确定性需求到不确定性需求的变化,是驱动企业数智化转型的基本动力。在企业数字化转型的早期,无论是客户关系管理,还是企业资源管理等信息化系统,都是基于大众化、规模化导向的确定性需求。在数智化转型时代,企业面对的是一个更加不确定的、个性化的、碎片化的市场需求。在这种不确定的需求背景下,企业要想获得市场的青睐,就必须把握好用户的痛点、诉求、问题,全方位提升用户的体验。
因此,数智化转型是数字化转型的高级阶段,数智化转型是建立在数字化转换(Digitization)、数字化升级(Digitalization)基础上,数据与算法深度结合,进一步触及公司核心业务,以新建一种商业模式为目标的高层次转型。“数字化”加速向“数智化”演进,不仅仅表现在智能化技术的应用上,还体现在产品形态、服务模式、管理思维上的全面升级。
1.从封闭孤立的技术体系走向开放融合的技术体系
数智化是技术的大融合,如图1-3所示。事实上,当前涌现出来各种各样的新技术,包括人工智能、区块链、云计算、大数据、物联网、5G等,它们背后有一个共同的逻辑:围绕数据,解决数据全流程中的特定问题。

图1-3 数智化是技术的大融合
其中,以机器学习和深度学习为代表的人工智能技术本质上是发现数据特征,解决数据预测的问题;区块链主要通过可信的数据账本,来解决数据信用的问题;云计算通过共享存储、网络和计算资源,解决数据处理过程中的存储和算力问题;大数据技术通过分布式批、流处理,解决海量数据的处理问题;物联网解决的是数据感知的问题;5G解决的是高速数据传输的问题。传统上,这些技术是独立发展的,而数智化需要将这些技术充分融合起来,实现“美第奇效应”。
技术的融合必然导致技术的开放,没有哪一家企业能够掌控所有的技术,也没有哪一家企业能够管理和运营如此复杂的技术体系。所以,数智化时代技术体系的建立,必然是“混合云”模式。这里的混合云不仅仅是指资源层面,将本地资源和云资源打通,更意味着将本地的技术体系和云端提供的面向公共服务的技术体系打通。实际上,不论是亚马逊的服务,还是谷歌、阿里的云服务,都通过云端来实现分布式数据库、海量数据分析、区块链、人工智能算法。
开源技术进一步推进了技术的开放,开源社区已经成为企业获取技术的主要源泉,头部技术企业也不断通过技术开源来建立技术生态。开源、开放成为数智化时代的鲜明特征。
2.从资产数据化到数据资产化
企业数字化的过程,从某种意义上就是企业资产数据化的过程。一方面,通过数字化实现资产的高效管理;另一方面,不断地通过在线化等手段,提升数字化资产的比例。过去,餐饮企业的门店位置至关重要,而现在餐饮企业在订餐平台上的口碑和评价更为重要,这些线上数据成为企业新的数字化资产。
企业在生产和经营过程中产生的大量数据,不仅仅对企业自身具有重要价值,更是企业的核心资源,是企业提升竞争力的源泉。进一步,这些数据可以通过要素化实现资产化,从而在数据市场中通过数据交易,获得更高的价值。这个过程就是“数据要素化,要素资产化,资产价值化”的过程。
为了提升数据资产的价值,企业除了需要不断完善数据治理能力,还需要提升数据聚合能力。简单来说,就是将数据“升维”。所谓数据升维,就是将同一对象(这个对象可能是系统、人等)、不同维度的数据整合起来,实现对对象的更加全面、深刻的认识。例如,用户精准画像、精准推荐系统、个人征信都需要将不同维度的数据整合起来“升维”,才能实现更好的效果。而不同维度的数据往往掌握在不同企业手里,这进一步驱动了企业将数据变成资产,通过数据共享交易获得数据价值的提升。
3.以产品为中心的运营能力到以客户为中心的敏捷能力
从企业的业务管理来看,数智化时代的企业需要具备敏捷的组织和反应能力,从而把握客户和市场的迅速变化,敏捷性是数智化时代的必然要求。传统的产品需求要进行系统化的分析论证、形成产品定义后再上线部署,而在敏捷迭代的方式下,企业通过用户角色模拟、聚焦小组分析、最小原型产品设计,可在最短时间内上线产品,迭代优化。在软件工业界,敏捷迭代已成为众多高效团队的制胜之道。
数智化是实现敏捷性的保障。通过数据快速把握变化,通过智能算法快速做出反应,这是数智化的要义。这个过程需要注意几个方面:第一,以客户为中心,“以客户为中心,提供优质的客户体验,保证密切的连接”,是行业的普遍共识;第二,数据驱动的决策,让数据说话,让数据成为决策的主要依据,是提升决策水平的关键;第三,构建智能认知能力,仅有数据是不够的,数据质量可能不高,或者存在偏见(往往由数据采集不均衡导致),因此,在数据基础上构建可解释的认知能力,也是数智化的核心目标。
1.1.4 数智化的发展趋势
1.数据和智能进一步融合,构建数据闭环
大数据和人工智能是一个硬币的两面。人工智能的发展浪潮中,大数据起到了重要的作用。例如,计算机视觉技术的发展离不开全球范围内的图像和视频数据的大规模标注和共享,谷歌开源的Google Open Images Dataset中含有900万张图片,YouTube-8M中包含800万段被标记的视频,而ImageNet作为最早的图片数据集,目前已有超过1400万张被分类的图片。
事实上,在当前人工智能各种各样的实际应用中,数据采集和数据标注是一项烦琐的工作。例如,在开发的牛脸智能识别系统中,数据库包含715种奶牛的30万张牛脸图片。数据采集过程中,奶牛运动、场景光照、设备分辨率、拍摄角度、采集后照片畸变程度等因素都会影响数据质量,从而影响最终训练效果,因此需要投入大量人力资源进行检查,提高数据可用度。据统计,牛脸智能识别系统的模型训练时间和数据整理时间比例为1:9。
对于越来越多的人工智能应用而言,数据永远追赶不上模型的需求。尽管在算法上,可以通过半监督学习、迁移学习等新的模型来降低对数据的需求,然而,在解决实际问题的过程中,最重要的还是要构建“数据闭环”。所谓数据闭环,就是在系统设计过程中,需要将算法执行的结果反馈到系统中以产生新的数据,并且通过不同来源的数据进行交叉验证,甚至相互“标注”,使得模型优化的过程和数据生产的过程共同进行、相互促进。
2.智能从感知到认知,可解释性是关键
得益于算力的大幅提升、数据类别的日益丰富以及以深度学习为代表的算法上的突破,以图像识别、语音识别为代表的感知智能近年来取得了突飞猛进的进步,并且在金融、零售、教育、安防、智慧城市等诸多行业与领域得到了应用。
感知智能的技术发展得益于巨量的数据以及瀑布式的数据驱动训练模式,这需要有大量的专业级人工标注进行支持;同时,感知智能技术对数据的利用程度还停留在表面,多是基于符号层面的模式识别,对于数据背后蕴含的逻辑和意义,感知智能还远不能理解。
认知智能技术指的是从海量数据中不断挖掘、提炼和汇聚知识,获取更深层次的认知,从而更好地了解客观世界。正如DIKW模型(Data-to-Information-to-Knowledge-to-Wisdom Model)所示,认知智能旨在将数据、信息、知识、智慧体系打通,从而将垂直行业中人类专家的知识、经验、理念等融合,使AI在各垂直行业中纵深落地。
因此,从感知智能到认知智能的跨越,是破解数据数量种类不足、标注繁重、利用率低等难题的重要方式。需要注意的是,在从感知智能到认知智能的路径上,并非是一个单向的过程,而是一个闭环的循环迭代过程。认知智能的提升反过来可以改善感知层数据采集和分析处理能力,这些能力又进一步提升认知智能的认知模型,实现数据和智能的交互反馈与强化。
人工智能研究与应用不断取得突破性的进展,从感知智能向认知智能发展。然而由于高性能的复杂算法、模型及系统普遍缺乏决策逻辑的透明度和结果的可解释性,导致在需要做出关键决策判断的国防、金融、医疗、法律、网安等领域中,或要求决策合规的应用中,人工智能技术及系统难以大范围应用。因此,人工智能的可解释性对未来人工智能的普及应用有重要的意义。人工智能的可解释性为其广泛应用提供了信任基础。有了信任基础,AI才可以在更广的范围内发挥更大的作用。但是,由于深度学习的基础理论还有待突破,算法的复杂性也在不断增加,当前人工智能的可解释性仍然面临巨大的挑战。相关的研究仍处在早期阶段,并没有形成广为接受的判断标准。
近年来,用户、企业、政府部门对数据的隐私安全意识日益增强。如何保证数据在安全、可信的情况下自由流动,成为大家的共同诉求。其中,重要数据难以确权、数据无法安全共享、隐私数据无可信处理环境等一系列问题成为阻碍数据流通的瓶颈。
区块链技术基于密码学理论构建分布式链式账本,其去中心化、不可篡改、透明可追溯等优势完美契合大数据时代下的数据确权和数据交换等需求。融合了密码学的块链式数据存储架构可有效做到数据的溯源和存证,全局公开透明的记账方式可解决数据确权的痛点,自动化、无人为干预的智能合约脚本可以做到数据加密后的安全传输和访问控制。区块链技术可有效改善数据流通、控制、确权和溯源的传统难题,但是,其对于解决隐私数据的可信计算略显乏力。
区块链与安全多方计算的结合则可以有效解决计算加密的难题。通过安全多方计算,各参与方仅需提供隐私数据输入,链上智能合约进行函数分析并自动化执行协同计算任务,各方除正确计算结果外,无法得到其他任何有效信息,不泄露原数据,做到了数据的隐私计算。在隐私计算基础上,结合区块链技术与联邦学习技术,在去中心化、各节点互不信任的网络中,建立数据处理模型,联合多方、多节点训练人工智能模型,实现隐私数据不出库,完成隐私数据的隔离与保护。
未来更广范围内的数据治理可以分为三个层次:底层以各方本地数据库为基础建立数据层,提供隐私数据的输入;中间层以区块链技术+安全多方计算为分布式架构,提供数据的可信存储、流通、确权和溯源支撑;上层以联邦学习为基础建立分布式的机器学习与数据处理模型,实现不同部门、不同企业在不泄露原数据下的协同计算,打破数据孤岛。
可以预见,融合了区块链技术和联邦学习的数据可信交换方案将有助于在更广泛的范围内实现隐私数据的安全共享和可信计算,具有广阔的应用前景。
3.人机协同智能
人机协同智能主要针对人与机器人共存的应用场景,机器与人通过交互协作共同完成某一复杂任务。从实现人机协同的层面来看,交互是其核心技术之一,自然交互能力主要包含人机对话能力、多模态的情感感知能力、人类意图理解能力、环境感知理解能力等。2021年12月,工业和信息化部、国家发展和改革委员会等15个部门正式印发《“十四五”机器人产业发展规划》,其中将“人机自然交互技术、情感识别技术”等列为“机器人核心技术攻关行动”的前沿技术,足见自然交互技术在未来机器人产业中的重要性。
人类的“智能”是在适应和理解复杂多变的物理和社会环境的过程中进化而来的,并非只适用于解决具有明确规则的任务。如何让机器能够像人一样思考,能够理解、解释并进行推理决策,获得人类所独有的认知能力,实现机器智能与人类智能的相互融合,知识图谱的地位一定是举足轻重的,知识图谱的向量表示使人们可以利用表示学习获得概念、类层次、实体和关系的嵌入,进而获得图结构、路径、子图的嵌入。同时,有关本体嵌入、规则学习的工作又使人们逐步能够在向量空间中实现一些简单的逻辑推理。而知识泛化就是利用知识图谱,将一个实体具体表达泛化为多样性表达,将一个实体泛化为一类实体。简单来说,就是通过知识泛化让机器具有“举一反三”的能力。
当机器具备一定的“知识”后,需要理解人的意图、将人的意图转化为机器人理解的触发条件才能够实现交互。在人机对话系统的实际应用场景中,意图识别是关键且极具挑战性的重要难题。将用户语义映射到预先定义好的用户意图类型的过程称为已知意图分类。发现未出现在预定义意图集中的用户未知意图类型的过程称为未知意图检测。良好的意图表示与意图分类是有效的交互意图理解的重要一环,也是实现人机协同共融的核心之一。
随着大数据与表征学习的不断融合、机器人制造业的发展,人机协同智能将会迎来更大的机遇与挑战。