梁吉业,博士,教授,主要研究方向为人工智能、粒计算、数据挖掘、机器学习.E-mail:ljy@sxu.edu.cn.
作者简介:
庞继芳,博士,副教授,主要研究方向为粒计算、智能决策、数据挖掘.E-mail:purplepjf@sxu.edu.cn.
宋 鹏,博士,教授,主要研究方向为智能决策、数据挖掘.E-mail:songpeng@sxu.edu.cn.
作为粒计算研究方向的核心概念和关键技术,多粒度计算强调对现实世界问题多视角、多层次的理解和描述,可获得合理、满意的求解结果.为了深化多粒度计算与决策分析的有效融合,更好地满足人们的实际决策需求,文中首先介绍多粒度粗糙集、多尺度数据分析、序贯三支决策、分层分类学习四类多粒度计算模型,并阐述各自的主要特点及发展过程.进而从属性约简、规则提取、粒度选择、信息融合、群决策、多属性群决策、分类决策、动态决策等方面总结基于多粒度计算模型的决策分析方法研究现状.最后,对大数据时代智能决策领域中若干具有挑战性的研究方向进行展望,以期推动多粒度智能决策的不断发展与创新.
LIANG Jiye, Ph.D., professor. His research interests include artificial intelligence, granular computing, data mining and machine learning.
About Author:
PANG Jifang, Ph.D., associate professor. Her research interests include granular computing, intelligent decision and data mi-ning.
SONG Peng, Ph.D., professor. His research interests include intelligent decision and data mining.
As the core concept and key technology of granular computing, multi-granulation computing emphasizes multi-view and multi-level understanding and description of real-world problems to obtain more reasonable and satisfactory results. The existing four types of multi-granulation computing models are firstly introduced, including multi-granulation rough set, multi-scale data analysis, sequential three-way decision and hierarchical classification learning, for the further effective fusion of multi-granulation computing and decision analysis and better satisfaction with actual decision-making needs. Then, their main characteristics and development process are expounded. Furthermore, the research status of decision analysis methods based on multi-granulation computing models is summarized from the aspects of attribute reduction, rule extraction, granularity selection, information fusion, group decision-making, multi-attribute group decision-making, classification decision-making and dynamic decision-making. Finally, some challenging research directions of intelligent decision-making in the era of big data are forecasted to promote the continuous development and innovation of multi-granulation intelligent decision-making.
本文责任编委 苗夺谦
Recommended by Associate Editor MIAO Duoqian
随着人、机、物三元世界的快速发展和深度融合, 人类已进入网络化的大数据时代, 社会各个领域涌现出大量的决策问题, 例如:工业领域的操作优化与资源分配、商业领域的个性化推荐与供应商选择、交通领域的车流控制与路径导航、医疗领域的疾病诊断与治疗策略等[1].在物联网、云计算、大数据与互联网等信息技术的持续影响和渗透下, 决策环境的开放程度越来越大, 决策过程中的不确定性因素越来越多, 决策数据的规模化和多样化日益凸显, 决策分析的难度不断升级.传统的数据处理技术和决策分析方法已难以满足大数据时代的决策需求.如何从大量复杂的决策数据中挖掘有价值的知识, 实现决策智能化成为当前人工智能研究的重要方向之一.
粒计算(Granular Computing)是复杂问题求解的一种计算范式, 属于人类较高层次认知机理研究的范畴.它以处理大规模复杂数据并建立有效计算模型为目标, 通过可行的满意近似解替代精确解, 实现问题的简化处理和高效求解[2, 3], 为现实决策分析提供有力的技术支持.然而, 单一粒度框架下的知识表示与数据处理方法已远不能满足实际应用需求, 多粒度逐渐成为粒计算研究方向的前沿和热点.作为粒计算中的一个核心概念, 多粒度强调对现实世界问题多视角、多层次的理解和描述, 可获得对于问题更合理、满意的求解结果.多粒度计算(Multi-granulation Computing)模型和方法在模拟人类自然智能的多视角、多层次认知学习机制方面具有显著的优越性, 在信息处理、知识表示及认知决策的模型构建与算法设计方面具有重要的理论意义和指导价值.将多粒度计算引入智能决策领域开展面向决策分析的多粒度计算模型与方法研究, 对于满足人们日益个性化、多样化、复杂化的决策需求, 推动决策智能化发展具有积极作用和意义.
本文在对多粒度计算模型进行分类梳理的基础上, 总结基于多粒度的决策分析方法及其应用, 并对未来可能的研究方向和发展前景进行讨论和展望, 为相关领域学者们开展进一步研究工作提供参考.
为了实现复杂决策数据的智能分析建模与融合求解, 学者们从粒的多层次和多视角两个维度对粒度的内涵和外延进行深入的分析和探讨, 建立适用于不同决策问题的多粒度计算模型, 主要包括多粒度粗糙集模型(Multi-granulation Rough Set Model)、多尺度数据分析模型(Multi-scale Data Analysis Model)、序贯三支决策模型(Sequential Three-Way Decision Model)和分层分类学习模型(Hierarchical Classification Learning Model).其中, 多粒度粗糙集模型[4]从信息融合视角出发, 通过不同粒度下的模式挖掘和粒度融合, 获取有效的决策知识.多尺度数据分析模型[5]主要从信息粒层视角出发, 通过研究不同尺度下决策规则在某种不确定性测度下的一致性和不变性, 选取合适的决策粒层和信息粒度进行分析.序贯三支决策模型[6]按照从粗粒度到细粒度的顺序展开渐进式三支决策, 可有效提高知识约简和规则提取的效率, 降低决策代价及测试代价.分层分类学习模型是为了提高大规模多分类任务的学习效率而提出的, 胡清华等[7]指出该模型通过充分发掘和利用数据类别之间的层次结构关系, 分层处理复杂的超多类学习问题, 可有效降低建模难度, 解决维数灾难问题.
粗糙集(Rough Set)是粒计算的三大理论基础之一.作为一种重要的数据分析处理方法, 粗糙集理论以信息系统为研究对象, 无需借助任何先验知识, 在保持分类能力不变的前提下, 通过属性约简导出问题的决策或分类规则, 为现实决策提供解释机制和技术支持.然而, 经典粗糙集模型是基于单个不可分辨二元关系的单一粒度框架, 无法从多粒度、多层次的角度对数据进行分析和处理.Qian等[4, 8]结合粒计算的观点, 考虑多个二元关系, 将单粒度粗糙集模型拓展至多粒度结构, 建立基于“ 求同存异” 思想的乐观多粒度粗糙集(Optimistic Multi-granulation Rough Set)和基于“ 求同排异” 思想的悲观多粒度粗糙集(Pessimistic Multi-granulation Rough Set).此后, 学者们对多粒度粗糙集进行深入研究, 相继提出多种适用于不同决策背景的扩展模型.
通过将多粒度计算思想引入决策粗糙集中, Qian等[9]提出多粒度决策粗糙集(Multi-granulation Decision-Theoretic Rough Set)的概念, 并在该框架下构建均值、乐观和悲观三类多粒度粗糙集模型.Li等[10]提出针对分布式模糊条件决策信息系统的多粒度决策粗糙集方法, 用于医疗诊断.通过多粒度粗糙集与覆盖粗糙集的有机结合, Zhan等[11]建立基于覆盖的乐观、悲观和变精度多粒度(I, T)-模糊粗糙集模型(Covering Based Multi-granulation(I, T)-Fuzzy Rough Set Model), 并讨论这些模型之间的相互联系.Feng等[12]结合变精度多粒度模糊粗糙集和三支决策, 提出变精度多粒度决策模糊粗糙集(Variable Precision Multigranulation Decision-Theore-tic Fuzzy Rough Sets).Ju等[13]在同时考虑测试代价和决策代价的基础上, 提出代价敏感多粒度粗糙集模型(Cost-Sensitive Multi-granulation Rough Set Model), 并建立基于条件熵的测试代价设定机制.考虑到基于单论域的粗糙集在实际应用中存在一定的局限性, Sun等[14]研究基于双论域的多粒度粗糙集模型(Multigranulation Rough Set Model over Two Universes), 使决策者可更高效地表达决策信息.
针对经典多粒度粗糙集无法处理连续数值型数据的问题, Lin等[15]结合多粒度粗糙集与邻域粗糙集, 发展基于邻域的多粒度粗糙集模型(Neighbor-hood-Based Multigranulation Rough Set Model).Zhan等[16]结合覆盖粗糙集、模糊粗糙集和多粒度粗糙集, 提出基于β -邻域的覆盖多粒度模糊粗糙集模型(Covering Based Multigranulation Fuzzy Rough Set Model), 并研究基于覆盖的乐观、悲观和变精度多粒度模糊粗糙集模型的公理化性质及三者之间的关系, 进而将模型应用到多准则群决策问题中.
在多源信息融合方面, 学者们发展一系列有针对性的多粒度粗糙集模型, 提升信息融合的效率和效果.Lin等[17]从模糊多粒度观点出发, 利用模糊粗糙集的包含度建立模糊多粒度决策粗糙集模型(Fuzzy Multigranulation Decision-Theoretic Rough Set Model), 为多源数据分析提供有效方法.Yang等[18]针对多源模糊信息系统, 提出广义、乐观、悲观三种多粒度粗糙集模型, 并给出相应的不确定度量方法.为了避免直接从多源信息系统中获取知识带来的信息损失问题, Sang等[19]建立广义多粒度双量化决策粗糙集(Generalized Multi-granulation Double-Quanti-tative Decision-Theoretic Rough Set), 并通过实验证实模型具有较好的容错性.为了实现多源决策系统的有效融合, Guo等[20]提出加权广义多粒度区间值决策粗糙集模型(Weighted Generalized Multi-granu-lation Interval-Valued Decision-Theoretic Rough Set Model).
在经典的信息系统中, 每个对象在每个属性上只能呈现一个观测值, 这样的信息系统称为单尺度标记信息系统.而在现实世界中, 人们观察物体或处理数据时, 会根据不同的尺度得到不同层次的观测值.为此, Wu等[5]基于多尺度标记属性, 提出多尺度数据的粒计算分析模型.该模型认为引起数据多粒度的原因是由于属性取值的不同尺度或粒度标记造成的.在该模型中, 同一批数据可标记为不同的粒度(或尺度)层次, 人们可根据需要在不同的尺度标记层面上处理和分析数据.描述此类数据的信息系统称为多尺度信息系统或多粒度标记信息系统.包含决策属性的多尺度信息系统称为多尺度决策系统或多粒度标记决策系统.在此基础上, Wu等[21]进一步研究不完备多尺度决策系统(Incomplete Multi-scale Decision Systems), 并讨论不同需求下的最优粒度选择问题.
上述多粒度标记信息系统都有一个共同的假设, 即系统中所有的属性都具有相同的粒度标记个数.然而, 在实际问题中, 不同的属性可能具有不同的粒度标记个数.针对这种情形, Li等[22]建立不同属性具有不同尺度标记个数的广义多粒度标记信息系统, 并研究该模型下的最优粒度选择方法.吴伟志等[23]结合文献[21]和文献[22]的研究思路, 提出广义不完备多粒度标记决策系统, 并讨论该模型下的粗糙集知识表示及最优尺度组合选择判别方法.为了从多尺度直觉模糊信息表中获取知识, Huang等[24]基于直觉模糊包含度, 发展适用于多尺度直觉模糊信息表的悲观和乐观多粒度决策粗糙集模型, 进而针对两类模型设计相应的最优尺度选择和属性约简算法.陈应生等[25]将划分推广为覆盖, 建立多尺度覆盖决策信息系统, 并利用布尔矩阵方法研究该系统的概念、性质及最优尺度组合选择问题.
在传统的接受、拒绝二支决策选项基础上, Yao等[6]将不承诺选项引入其中, 提出三支决策(Three-Way Decision)模型.该模型可有效规避对象认知不确定情况下误接受或误拒绝造成的损失, 是一种符合人类认知过程的“ 三分而治” 模型.目前, 三支决策理论已广泛应用于机器学习、认知计算、数据挖掘、模式识别等研究领域, 并在供应商选择、医疗诊断、风险评估、街道识别等实际应用中取得良好的效果.考虑到现实问题中决策知识的挖掘与获取往往是一个递进的过程, Yao进一步发展序贯三支决策[6], 通过对不承诺项的再研究, 细化对决策对象的认知粒度, 提高决策的准确性.
序贯三支决策为求解复杂问题提供一种模拟人类多粒度思维的渐进式问题求解模式, 一经提出就受到学者们的高度重视.Hao等[26]提出适用于多尺度决策表的序贯三支决策模型, 并构建最优层选择框架, 讨论新对象的增加对最佳规模层的影响.Fang等[27]建立粒度驱动的序贯三支决策模型(Granu-larity-Driven Sequential Three-Way Decision Model), 并在此基础上结合代价敏感学习, 研究决策过程代价最小化和决策结果代价最小化两类算法.Yang等[28]基于时空多层次粒度结构, 提出具有更高性能和更小代价的局部序贯三支粒计算方法(Local Sequential Three-Way Granular Computing Approach).Qian等[29]建立基于多个阈值的多粒度序贯三支决策模型(Multigranulation Sequential Three-Way Deci-sion Model).Yang等[30]基于三支粒计算概念和框架, 探讨多层邻域序贯决策方法(Multilevel Neigh-borhood Sequential Decision Approach).刘盾等[31]提出时间三支决策和空间三支决策两类模型, 并指出时间三支决策注重在动态决策环境下对序贯决策进行诠释, 主要考虑时间变化下实时性、多次性、序贯性的决策问题.空间三支决策基于多层次和多视角的粒计算思想, 考虑信息粒化过程中最优粒层和粒度的选择问题.
由于互联网和物联网的快速普及, 分类学习任务变得越来越复杂, 出现许多超大数量、超多类、超高维的学习问题, 如恒星光谱分类、ImageNet图像分类、网页分类等, 这给分类建模带来新的挑战.分层分类学习模型在充分挖掘和利用数据类别之间的层次结构和依赖关系的基础上, 采取逐层细化、分而治之的策略, 将超多类问题分解为多个子类学习任务, 可有效降低建模的难度, 实现大规模数据的高效组织和处理.
目前, 分层分类学习已引起机器学习、自然语言处理和计算机视觉领域学者的共同关注.Zhao等[32]设计基于递归正则化的分层分类特征选择框架(Recursive Regularization Based Feature Selection Framework for Hierarchical Classification), 针对不同的子分类任务选择不同的特征子集进行处理.Wang等[33]结合模糊粗糙集理论, 构建基于深度模糊树的大规模分层视觉分类模型(Deep Fuzzy Tree Based Large-Scale Hierarchical Visual Classification Model).白盛兴等[34]考虑到特征空间的动态演化特性, 提出基于邻域粗糙集的层次分类在线流特征选择算法.胡清华等[7]在介绍分层分类定义的基础上, 系统阐述大规模分层分类任务中的评价指标设计、层次结构建立、分层特征选择、分层分类器学习、停止机制设计等基本问题, 并指出该领域未来可能的研究方向.
多粒度计算为现实世界中复杂决策问题的粒化分析和高效求解提供新的思路.学者们基于上述多粒度计算模型, 从不同的粒度出发或通过多粒度层次之间的转换与融合构建适用于不同决策问题的多粒度分析方法.本文主要从属性约简(Attribute Reduction)、规则提取(Rule Extraction)、粒度选择(Granularity Selection)、信息融合(Information Fu-sion)、群决策(Group Decision-Making)、多属性群决策(Multi-attribute Group Decision-Making)、分类决策(Classification Decision-Making)、动态决策(Dynamic Decision-Making)等方面对相关研究进行分类梳理.
属性约简又称为特征选择(Feature Selection), 是一个保持系统某种特性不发生改变以计算属性全集的极小子集的过程.作为知识获取和决策分析的一个重要预处理步骤, 属性约简有助于获取关键决策指标, 简化决策系统, 提升决策效率.Liang等针对大规模数据集, 提出融合多粒度近似约简的高效粗糙特征选择算法(Efficient Rough Feature Selection Algorithm)[35].进而针对对象批量增加的大规模动态数据集, 发展基于信息熵的批增量式粗糙特征选择方法(Group Incremental Approach to Feature Selection)[36].Gu等[37]研究多尺度标记决策系统中的属性约简算法.Qian等[38]讨论动态粒度下序贯三支决策的属性约简问题, 提出满足概率正域单调性的属性约简算法, 能帮助决策者在最优粒度层次上做出正确决策.Kong等[39]基于多粒度上下近似的概念, 提出任意并约简、邻域并约简、邻域交约简三种多粒度信息系统属性约简算法, 并探讨最优约简的选择策略.为了提高分类性能, Sun等[40]利用Lebesgue测度和熵测度, 发展不完备邻域决策系统中基于邻域多粒度粗糙集的属性约简方法(Neighborhood Multi-granulation Rough Sets-Based Attribute Reduc-tion Approach).She等[41]在综合考虑属性个数和属性尺度两方面影响因素的基础上, 提出多尺度决策表中的广义约简(Generalization Reducts)概念, 并在此基础上研究最优决策规则集的提取过程, 进而将广义约简与属性约简进行对比分析.
规则提取就是从数据类型多样的海量数据中挖掘一个好的规则集合, 包含的规则数量尽可能少, 支持度尽可能大, 每个规则尽可能短.为了提高规则的实用性和灵活性, 学者们结合多粒度计算思想, 对规则提取算法开展一系列创新性的探索研究.陈静雯等[42]提出基于最大粒的悲观邻域多粒度粗糙集规则获取算法, 旨在从多粒度、多层次的角度处理数值型或混合型数据.针对大规模数据产生的规则数量众多, 容易导致过拟合等问题, Feng等[43]遵循分而治之的策略, 提出层次决策规则挖掘方法(Hie-rarchical Decision Rules Mining), 结合多维数据模型的层次结构与粗糙集理论, 提高决策规则挖掘的质量和效率.She等[44]讨论强协调、一般协调和完全不协调三种多粒度决策系统的规则约简.Li等[45]从规则的区别与联系、规则的支持度和确信度因子及规则获取的算法复杂度分析等方面研究多粒度粗糙集和概念格之间的关系.Singh等[46]利用区间值模糊集、粗糙集和粒计算概念, 提出解决分类和决策问题的四支区间值决策空间方法, 并通过提取本质上突出的决策规则的粒度层次, 得到基于某一特定区域的精确决策.
粒度选择是多粒度计算领域特有的问题, 也是分析和解决复杂决策问题的关键环节.粒度选择就是在不同的粒度空间中选择合适的粒度层次对问题进行求解.粒度层次选取的好坏直接影响决策的效率和质量.Wu等[21, 47, 48]研究不同多粒度标记框架下的信息粒度表示、最优粒度选择及规则提取问题, 包括多尺度决策系统、多尺度序信息系统、不完备多尺度决策系统.She等[44]提出针对多粒度标记决策系统的局部最优粒度选择和规则提取方法.顾沈明等[49]针对不完备多粒度决策系统, 讨论局部最优粒度的选择问题, 并给出基于局部最优粒度的属性约简和规则提取方法.梁美社等[50]考虑可能会出现的正域很小或为空集的情形, 提出基于局部广义多粒度粗糙集的多标记最优粒度选择方法.Cheng等[51]发展基于序贯三支决策的最优尺度组合选择方法(Optimal Scale Combination Selection), 能快速获取多尺度决策表中所有的最优尺度组合.Tan等[52]探讨双论域下多粒度粗糙集的粒度选择算法和规则提取方法, 用于疾病诊断问题.
多粒度计算模型的出现为多源信息系统的有效融合提供崭新的研究视角和解决方案, 有助于增强多源信息系统处理不确定性问题的能力.Hu等[53]建立基于模糊格和偏序集的三支决策空间, 研究从多个三支决策空间向单个三支决策空间转换的方法, 包括加权平均三支决策、最大最小三支决策以及中位数三支决策等.Huang等[54]为了提高三支概念理论在处理大型或多源数据上的信息融合能力, 基于认知算子开发针对大型和多源数据的三支概念学习并行计算技术.为了避免信息丢失, 提高融合效果, Yang等[55]提出适用于多源决策系统的多粒度信息融合方法.Wei等[56]梳理多源、多模态、多尺度、多视角等复杂信息系统中的信息融合方法和技术, 分析并讨论多粒度粗糙集、多粒度粗糙近似及其扩展情形在信息融合中的作用.Zhang等[57]分析对比多粒度、多尺度、多视角决策信息融合模型和技术, 对粗糙集理论研究领域中的多源信息融合方法及其应用进行全面的阐述和回顾.
随着多粒度计算的快速发展和普及, 基于多粒度的群决策分析逐渐引起学者们的研究兴趣.Han等[58]针对犹豫模糊语言环境下的群决策问题, 提出基于比较的排序算法, 处理多粒度尺度评价的集结过程, 并引入两个可调的可能性阈值, 控制群体共识直接影响得分的输出粒度.Mandal等[59]发展多粒度区间模糊概率粗糙集模型(Multi-granulation Interval-Valued Fuzzy Probabilistic Rough Set Model), 用于解决具有区间模糊偏好关系的群决策问题, 进而构造多粒度区间模糊决策粗糙集方法, 对模型中的参数进行合理的解释和设置.Chu等[60]基于偏好度建立多粒度序贯三支群体冲突决策方法(Multi-granu-larity Sequential Three-Way Group Conflict Decisions Approach), 并应用于中西药融合的决策问题.Zhan等[61]分析多专家群决策信息系统与多尺度信息系统之间的联系, 建立基于多尺度信息系统的多专家群决策方法, 并用于公司项目经理的评选.
多粒度计算模型与方法在处理多属性群决策问题方面具有显著的优越性, 学者们将多粒度计算与多属性群决策有机结合, 从理论和应用两方面展开系统、深入的研究, 并取得丰硕的研究成果.Zhan等[11]结合基于覆盖的多粒度模糊粗糙集模型与多属性群决策问题, 提出两类决策分析算法, 并对应聘软件公司系统分析工程师的人员进行排序和择优.Zhang等[62]针对区间犹豫模糊多属性群决策问题, 提出处理决策者共识和冲突的多粒度三支决策方法, 并用于并购目标选择决策.Pang等[63]将多粒度思想引入不确定语言多属性群决策问题中, 构建由粗到细的多级共识度指标体系, 进而提出自适应群体共识达成方法(Adaptive Consensus Method for Multi-attribute Group Decision Making), 并应用到风险投资问题.Pang等[64]还针对区间直觉不确定语言多属性群决策问题, 提出基于多粒度权重和三支决策的多属性群决策方法(Multi-attribute Group Decision-Making Method Based on Multi-granulation Weights and Three-Way Decisions), 并用于物流供应商的评价与选择.该方法不仅可获得方案集的细粒度排序结果, 还能实现各方案的粗粒度分级.Wang等[65]发展多粒度代价敏感序贯三支决策模型, 处理不确定条件下的多属性群决策问题, 并结合公路交通事故的应急诊断与处理实例验证方法的有效性.为了解决复杂、高风险的多属性群决策问题, Wang等[66]提出序贯三支多属性群决策方法(Sequential Three-Way Multiple Attribute Group Decisions), 并在此基础上探讨基于社会影响的群体共识达成策略.该方法允许不同专家在不同属性集下对方案集进行评价, 具有较强的实用性和灵活性, 并用于乳腺癌和心脏病的多学科诊疗.
考虑到双论域在决策表达方面的优势, 学者们对双论域上的多粒度计算模型进行扩展研究, 并提出相应的多属性群决策方法.Sun等[67]建立双论域上的变精度多粒度模糊决策粗糙集(Variable Preci-sion Multigranulation Fuzzy Decision-Theoretic Rough Set over Two Universes), 并利用双论域上的三支决策概念获取决策规则, 进而将该方法应用于医疗诊断问题.Zhang等[68]有机结合犹豫模糊集与多粒度粗糙集, 建立双论域上的犹豫模糊多粒度粗糙集模型, 并提出基于该模型的多属性群决策方法, 进而用于人岗匹配问题.Sun等[69]针对决策成员评价属性集不同的多属性群决策问题, 提出双论域上基于多种二元关系的模糊多粒度粗糙集模型(Diver-sified Binary Relation-Based Fuzzy Multigranulation Rough Set over Two Universes ), 并用于非常规能源事件应急预案的评价中.Lei等[70]在综合考虑决策者的有限理性和属性之间相互影响的基础上, 发展犹豫模糊语言环境下基于双论域的行为多粒度决策粗糙集模型(Behavioral Multigranulation Decision-Theoretic Rough Set), 并结合前景理论和Choquet积分, 设计三支群决策方法, 应用于绿色供应商选择问题.
在分类决策方面, Dai等[71]提出基于协同训练的序贯三支决策方法(Co-training Approach for Se-quential Three-Way Decisions), 降低分类的代价和错误率.Zhang等[72]从两个相邻粒层的分类精度差异出发, 建立基于惩罚函数的序贯三支决策模型(Sequential Three-Way Decisions Model Based on Penalty Function), 通过调整代价参数提高分类决策精度.针对多分类决策问题中存在的代价不平等和规则冲突问题, Yang等[73]提出基于贝叶斯决策过程的序贯三支决策方法, 提高多分类决策的计算效率.为了更好地解决多分类三支决策中的决策冲突问题, Xu等[74]提出在决策过程中逐步增加信息以消除冲突的序贯方法, 即三序贯多分类三支决策模型(Three Sequential Multi-class Three-Way Decision Model).考虑到误分类风险对实际应用的影响, Wang等[75]针对大规模分类任务, 提出利用语义层次对风险进行定义和最小化的分层分类方法(Hierarchical Semantic Risk Minimization for Large-Scale Classification), 能得到全局风险最小的分类预测结果.
多粒度计算具有较强的灵活性和实用性, 在决策分析领域的作用和优势正逐渐得到学者们的重视.经过近十年的发展, 基于多粒度计算模型与方法的决策分析研究已取得初步进展, 但目前仍处于探索阶段.今后需进一步结合具体领域的实际应用, 深入研究和发展革命性、可满足时代需求的多粒度智能决策新方法和新技术, 为大规模复杂决策问题的分析建模和融合求解提供强大的技术支撑.
1)异构决策信息的多粒度分析与融合.在现代社会经济高速发展的背景下, 决策的个性化和差异化日益凸显, 大量异构决策信息不断涌现.尤其是在多属性群决策过程中, 由于决策成员对评价指标体系中的所有指标(即属性)不一定都熟悉或感兴趣, 每名成员会根据自己的情况, 选取部分评价指标, 建立自己的评价指标集(即属性集), 如疾病会诊、供应商选择等.同理, 决策成员也不一定对所有的评价方案都了解, 特别是当方案数量较多时, 不同的决策成员可选择属于自己领域的方案进行评价, 建立自己的评价方案集, 如学术论文评审、科技项目评价等.此外, 每个成员还可使用不同形式、不同粒度的评价信息以表达个体偏好.这类形式、结构不尽相同的异构决策信息加剧决策过程的不确定性和决策分析的复杂性.为了实现不同粒度空间的联合计算和协同决策, 就需要发展面向异构决策信息的多粒度分析与融合方法, 在异质评价信息的度量与转换、异构信息系统的相关性分析与多粒度融合等方面取得突破性进展, 驱动决策智能化.
2)群体决策结果的多粒度表示与反馈.现有的多属性群决策方法大多只是根据方案的综合评价值给出最终排序结果, 并认为排名第一的方案即为最佳选择.然而, 通过这种方式得到的决策结果可能并不符合实际要求, 且缺乏必要的可解释性.事实上, 决策者往往并不关心方案之间的绝对序关系, 而更关注哪些方案较好、哪些方案较差, 即方案的档次或等级.为此, 需要建立有效的决策反馈机制, 帮助决策者明确方案对问题的适合程度, 以便做出更加科学、合理的决策.在结果表示方面, 除了传统的综合评价值及细粒度排序结果以外, 还应发展具有适应性的粗粒度分级决策模式, 满足不同决策者的实际需求.在规则提取方面, 可构建高效的多粒度分级决策规则挖掘算法和融合策略, 形成具有较强解释性和指导性的反馈信息, 并用于预测新方案所属的等级.在结果分析方面, 研究风险态度、最优粒度、等级划分等因素对决策结果和分级规则的影响, 建立全局敏感性和稳健性分析模型, 为决策者提供更可靠、更具个性化的参考依据.
3)针对动态决策数据的多粒度计算与分析.随着物联网与云计算的蓬勃发展, 决策数据呈快速变化态势, 信息系统和决策系统也由静态环境拓展到更复杂的动态更新环境中.为了有效应对实时在线分析的决策需求, 需要将多粒度计算引入动态决策数据的挖掘和分析, 设计高效的增量式决策算法, 如增量式属性约简、增量式对象约简、增量式规则约简等, 发现决策更新过程中的重要属性、对象和规则.进而基于动态多粒度原理建立决策的演化模型, 从多层次、多视角分析决策数据动态变化过程中的关联模式, 捕捉决策规则支持度的变化规律及决策规则之间的趋势和继承性, 对未来将要发生的决策做出预测, 或给出可能出现的决策的发生概率, 以便决策者对系统未来的演化做出判断.针对不同应用背景下动态决策数据的特点, 构建适合的多粒度增量式计算模型与关联分析方法, 实现决策的实时优化, 这已成为当前人工智能研究的重要课题之一.
4)面向移动大数据的多粒度决策建模.随着信息网络技术的迅猛发展和移动智能终端的广泛普及, 移动互联网在社会、经济、生活中扮演着越来越重要的角色.相比传统互联网, 移动互联网从时间和空间上拓展人与网络的交互机会, 产生的移动大数据表现出规模更大、维度更高、社会性与个性化更明显等特点.由于移动互联网的核心节点是具有社会性的人, 作为网络空间大数据和应用服务的贡献者, 他们构成支撑大量成功应用的群智资源.有效利用移动大数据中蕴含的丰富的群智资源, 开展群智协同决策研究是目前人工智能领域关注的研究热点之一, 在灾难应对、疾病预防、金融普惠、环境治理、数字政府、智慧城市等领域具有积极影响.将多粒度计算、群决策分析与大数据技术和机器学习方法有机结合, 构建面向移动大数据的多粒度决策模型, 有望实现基于群智感知的知识获取和开放动态环境下的群智融合与增强, 进而在群智协同决策方面取得创新性成果.
5)云计算环境下的多粒度智能决策.云计算环境是近年来在互联网基础上建立的一种新型信息服务环境, 云计算环境下海量的信息服务和决策资源能为智能决策过程提供有效支持.然而, 决策环境的开放性、决策资源的虚拟化、决策问题的非结构化及问题求解的协作性使云计算环境下决策问题的求解难度增加, 特别是对于重大工程决策、大型企业管理决策、社会公共事件处理决策等复杂大群体决策问题, 就显得更加困难[79].如何实现云计算环境下复杂大群体决策的大规模协同求解是粒计算与智能决策领域共同关注的热点和难点问题.在现有的系统理论、运筹方法和信息技术的基础上融入多粒度计算思想和大群体决策方法, 发展云计算环境下的多粒度智能决策是解决该问题的一个重要途径.多粒度计算可用于对复杂大群体决策问题进行分解和简化, 实现并行求解.大群体决策则用于权重计算、共识度量和信息集结, 实现协同决策.
6)基于多粒度的决策可视化研究.可视化是利用计算机图形学和图像处理技术, 将数据转换成图形或图像在屏幕上显示出来, 再进行交互处理的理论、方法和技术.在大数据背景下的政府或企业决策中, 常常需要对不同部门领域的数据, 及多个部门的混合数据, 从不同的角度或层次进行观察和分析, 将决策结果按主题、成系统地加以呈现, 便于决策者或管理者掌握问题在不同维度下的规律, 了解事物发展的态势.因此, 探索基于多粒度的决策可视化技术就显得尤为重要.未来可从如下几方面展开研究:通过融入多尺度、多层次的方法, 实现信息在不同解析度上的展示, 允许用户自主控制展示的解析度; 通过整合多个视图, 同时展现不同维度下信息呈现的规律及关联关系, 辅助用户从多个角度进行综合决策; 同步展示时间和空间两个维度的相关信息, 实现纵横联动, 帮助用户全面掌控决策变化态势.发展基于多粒度的决策可视化技术有望显著提升决策的运行效率、质量和水平, 使决策变得可知可感, 在应急指挥可视化、城市管理可视化、智能交通可视化、智慧园区可视化、公共安全可视化等领域具有潜在的巨大应用价值.
多粒度计算是人类认知与实践的一种天然特性, 是粒计算框架下复杂问题求解的内在逻辑要求.发展基于多粒度计算模型与方法的智能决策技术, 对于实现复杂决策数据的智能分析建模与融合求解具有重要的理论价值和现实意义.目前, 多粒度计算与决策分析的相互融合与促进已成为人工智能领域显著的发展趋势之一.为了推动多粒度智能决策理论与方法的快速发展, 本文对多粒度计算模型及其在决策分析领域的发展和应用进行梳理、总结与展望.在介绍四种典型的多粒度计算模型及其扩展形式的基础上, 总结决策分析领域近年来涌现出的多粒度计算方法的研究成果及发展动态, 进而从六个方面对未来研究方向进行初步探讨, 分析今后发展可能会遇到的若干关键科学问题, 以期为相关领域的学者们开展进一步研究工作提供参考.
[1] |
|
[2] |
|
[3] |
|
[4] |
|
[5] |
|
[6] |
|
[7] |
|
[8] |
|
[9] |
|
[10] |
|
[11] |
|
[12] |
|
[13] |
|
[14] |
|
[15] |
|
[16] |
|
[17] |
|
[18] |
|
[19] |
|
[20] |
|
[21] |
|
[22] |
|
[23] |
|
[24] |
|
[25] |
|
[26] |
|
[27] |
|
[28] |
|
[29] |
|
[30] |
|
[31] |
|
[32] |
|
[33] |
|
[34] |
|
[35] |
|
[36] |
|
[37] |
|
[38] |
|
[39] |
|
[40] |
|
[41] |
|
[42] |
|
[43] |
|
[44] |
|
[45] |
|
[46] |
|
[47] |
|
[48] |
|
[49] |
|
[50] |
|
[51] |
|
[52] |
|
[53] |
|
[54] |
|
[55] |
|
[56] |
|
[57] |
|
[58] |
|
[59] |
|
[60] |
|
[61] |
|
[62] |
|
[63] |
|
[64] |
|
[65] |
|
[66] |
|
[67] |
|
[68] |
|
[69] |
|
[70] |
|
[71] |
|
[72] |
|
[73] |
|
[74] |
|
[75] |
|
[76] |
|
[77] |
|
[78] |
|
[79] |
|