协调广义决策多尺度序信息系统的知识获取
张嘉茹1,2, 吴伟志1,2, 杨烨1,2
1.浙江海洋大学 信息工程学院 舟山 316022
2.浙江海洋大学 浙江省海洋大数据挖掘与应用重点实验室舟山 316022
通讯作者:吴伟志,博士,教授,主要研究方向为粗糙集、粒计算、数据挖掘、人工智能.E-mail:wuwz@zjou.edu.cn.

作者简介:张嘉茹,硕士研究生,主要研究方向为粗糙集、粒计算.E-mail:1697628349@qq.com.
杨烨,硕士研究生,主要研究方向为粗糙集、粒计算.E-mail:1523562213@qq.com.

摘要

决策多尺度信息系统是一类特殊的数据集,系统中的每个对象无论在条件属性集上还是在决策属性上都可取多个尺度的标记值,并且从细粒度标记属性值到粗粒度标记属性值有一个信息粒度变换.文中针对广义决策多尺度序信息系统的知识获取问题展开研究.首先,引入尺度选择概念,一个尺度选择对应一个单尺度的序决策系统,并将优势关系引入广义决策多尺度信息系统,给出在不同尺度选择下对象集的优势类和集合的下近似和上近似的定义及其性质.然后,在协调广义决策多尺度序信息系统中定义5种最优尺度选择的概念,证明实际上只有2种不同类型的最优尺度选择,即最优尺度选择、下近似最优尺度选择、信任最优尺度选择是等价的,而上近似最优尺度选择与似然最优尺度也是等价的.最后,给出协调广义决策多尺度序信息系统的辨识矩阵约简方法,并在最优尺度选择基础上给出蕴含在协调广义决策多尺度序信息系统中的序决策规则.

关键词: 多尺度序信息系统; 尺度选择; 粗糙集; 粒计算; 知识获取
Knowledge Acquisition for Consistent Generalized Decision Multi-scale Ordered InforMation SysteMs
ZHANG Jiaru1,2, WU Weizhi1,2, YANG Ye1,2
1.School of InforMation Engineering, Zhejiang Ocean University, Zhoushan 316022
2.Key Laboratory of OceanograPhic Big Data Mining and APPlication of Zhejiang Province, Zhejiang Ocean University, Zhoushan 316022 decision Multi-scale ordered inforMation systeMs are exPlored.
Corresponding author:WU Weizhi, Ph.D., professor. His research interests include rough set, granular computing, data mining and artificial intelligence.

Author:ZHANG Jiaru, master student. Her research interests include rough set and granular computing.
YANG Ye, master student. Her research interests include rough set and granular computing.

Abstract

A decision Multi-scale inforMation systeM is a sPecial tyPe of Multi-scale data set and each object under each attribute in the systeM froM either the condition attribute set or the decision attribute is rePresented by different scales at different levels of the granulations, holding a granular inforMation transforMation froM a finer to a coarser labelled value. To solve the ProbleM of knowledge acquisition in generalized decision Multi-scale ordered inforMation systeMs, the concePt of scale selection is firstly defined. Each scale selection is linked with a single-scale ordered decision systeM. DoMinance relations are also introduced into decision Multi-scale inforMation systeMs, rePresentations of inforMation granules as well as lower and uPPer aPProxiMations of sets under different scale selections are Presented, and their relationshiPs are exaMined. Then, five tyPes of oPtiMal scale selections in consistent generalized decision Multi-scale ordered inforMation systeMs are defined. It is Proved that there are indeed two different tyPes of oPtiMal scale selections. The notions of oPtiMal scale selection, lower aPProxiMation oPtiMal scale selection and belief oPtiMal scale selection are all equivalent, and a scale selection is uPPer aPProxiMation oPtiMal if and only if it is Plausibly oPtiMal. Finally, based on oPtiMal scale selections, a Method of discernibility Matrix attribute reduction and ordered decision rules hidden in consistent generalized decision Multi-scale ordered inforMation systeMs are exPlored.

Key words: KMulti-scale Ordered InforMation SysteMs; Scale Selection; Rough Sets; Granular CoMPuting; Knowledge Acquisition

粒计算(Granular CoMPuting, GrC) [1, 2, 3, 4]是人工智能领域活跃的研究方向之一.它模拟人类问题思考模式, 以粒(Granule)为基本计算单位, 通过信息粒化等手段达到简化复杂问题求解的主要目标.粒计算的研究主要集中在粒的描述、表示与构造, 粒的多层次合成与分解, 具有多层次或多粒度结构数据的信息粒的变换、最优粒度或尺度的选择, 蕴含在数据集上的粒与粒之间的IF-THEN规则的提取, 以及粒结构的不确定性分析等.目前, 粒计算已成为大数据挖掘与决策分析的一种重要研究方法[5, 6, 7, 8, 9].

粗糙集[10]是推动和发展粒计算研究的一个重要数据分析模型, 它以各种各样的信息系统(InforMation SysteMs)或决策系统(Decision SysteMs)为数据分析对象, 通过定义在数据样本集上的二元关系构造“ 粒” , 粒化论域或样本空间, 并通过属性约简方法挖掘蕴含在数据集上的决策规则集.传统粗糙集数据分析呈现的数据集大都是单尺度形式的, 即信息系统中每个对象在每个属性上只取唯一的值.然而, 在实际生活中, 人们可能需要在多粒度或多尺度环境下处理和分析数据, 要在不同尺度下对同一对象在同一属性下的数据进行观察、分析并做出相应决策.为此, Wu等[11]提出多尺度粗糙集数据分析模型, 处理的数据集称为多尺度信息系统, 系统中的每个对象在同个属性下根据不同的尺度呈现不同标记的值, 并且从细尺度的属性值到粗尺度的属性值都有相应的信息粒度变换.这种数据处理模型又称为Wu-Leung模型[12].在该模型中, 较细尺度对应的数据所含信息较详细, 但是意味着获取信息成本较高, 而较粗尺度对应的数据所含信息较少, 获取信息成本也较低.在实际问题研究中, 选取合适尺度去解决问题就显得至关重要.多尺度粗糙集数据分析的核心思想是:根据决策目标, 对每个属性选择一个合适的尺度或粒度(称为最优尺度), 构成一个新的单尺度信息系统, 再在保持相同目标约束要求下使用粗糙集方法给出属性约简, 做出最终的决策(如分类、聚类或排序决策等).因此, 多尺度信息系统或多尺度决策系统中的最优尺度选择是从该类数据集上获取知识的关键步骤, 现已成为多尺度粗糙集数据分析的一个重要研究方向[13, 14, 15, 16, 17, 18, 19, 20, 21].

经典Wu-Leung模型的一个基本假设是数据集上所有属性具有相同的尺度个数, 并且在数据分析时只能取同层尺度.然而在实际问题中, 数据集上不同属性可能具有不同的尺度个数, 为此, Li等[12]引入尺度组合的概念, 提出广义多尺度信息系统的知识获取模型.近年来, 针对各类广义多尺度信息系统的最优尺度组合及知识获取的研究受到相关研究人员的关注, 并取得重要进展[22, 23, 24, 25, 26, 27, 28, 29, 30].由于Li等[12]提出的广义多尺度决策表的决策属性是单尺度的, 在实际应用中, 同一对象的决策属性也可能根据不同尺度取不同的值.为此, Huang等[31]提出决策属性也是多尺度的广义多尺度信息系统(简称为广义决策多尺度信息系统)的数据分析模型, 研究协调广义决策多尺度信息系统的最优尺度选择方法.

证据理论, 又称DeMPster-Shafer证据理论[32](简称D-S证据理论), 是处理不精确和不确定性问题的数学工具之一.它的核心思想是通过由信任结构导出的一对信任函数与似然函数刻画概念的不确定性.粗糙集理论的下近似集与上近似集和证据理论的信任测度与似然测度可分别看作是对同个不确定概念(集合)的定性和定量不确定性表示, 因此, 两个理论具有很强的关联性.相关研究已证实, 由粗糙近似空间导出的集合的下近似概率和上近似概率一定是某个信任结构下的信任测度与似然测度, 反之, 任给一个信任结构及其导出的信任函数与似然函数, 一定可表示为某个粗糙近似空间下的下近似概率和上近似概率[33, 34, 35].基于这两个理论之间的关系, 学者们提出利用证据理论进行粗糙集数据分析, 取得很多重要成果[36].近几年, 使用证据理论刻画多尺度环境下的最优尺度选择也取得一些研究进展.

众所周知, 多属性决策或排序是粗糙集数据分析中一类重要的研究问题, 也是现实生活中较常见的数据处理问题.Greco等[37, 38, 39]定义序信息系统中属性(在序信息系统中又称为准则)子集导出的优势关系, 提出基于优势关系的粗糙集方法(DoMi-nance-Based Rough Set APProach, DRSA), 解决序信息系统或序决策系统的序IF-THEN规则的提取或排序问题.随后, 针对不同数据类型的DRSA也相继被提出[40, 41, 42, 43].Xu等[44]使用证据理论的信任函数与似然函数, 研究序信息系统的属性约简问题, 而Du等[45]使用证据理论的信任函数与似然函数, 讨论序决策系统的属性约简问题.

近年来, 针对多尺度环境下信息系统的多属性决策、排序等问题已受到相关领域研究人员的关注[46, 47, 48].Zheng等[20]研究Wu-Leung模型下多尺度序信息系统的最优尺度选择问题, 使用证据理论中的信任函数与似然函数等价刻画协调和不协调多尺度序决策系统中下近似最优尺度和上近似最优尺度的特征.

尽管多尺度环境下很多数据类型的最优尺度选择和知识获取方面的研究取得重要进展, 但迄今未有学者对决策属性也是多尺度的多尺度序信息系统(称为决策多尺度序信息系统)的知识获取方面展开研究.本文在文献[20]和文献[31]基础上, 探索研究协调决策多尺度序信息系统的最优尺度选择及其相应的序决策规则提取问题.

1 基本知识

在本文中, 对于给定的非空有限集合U={x1, x2, …, xr}(也称为论域), 记P(U)为U的幂集.对于X∈ P(U), 记~XXU上的补集, 即

~X=U-X={xU|xX}.

定义1[10]S=(U, A)为一个信息系统, 其中U={x1, x2, …, xr}为一个非空有限对象集, 称为论域, A={a1, a2, …, aM}为一个非空有限属性集, 对于∀ aA, 有aUVa, 即a(x)∈ Va, xU, 其中

Va={a(x)|xU}

为属性a的值域.

对于信息系统S=(U, A), BA, 记

RB={(x, y)∈ U× U|a(x)=a(y), ∀ aB},

RB为由属性子集B诱导的不可分辨关系, RB可将U中元素分成两两不相交的等价类, 即

[x]B={yU|(x, y)∈ RB}, ∀ xU,

它们构成U的一个划分, 即

U/RB={[x]B|xU}.

对于X∈ P(U), X关于属性子集B的下近似和上近似定义如下:

RB¯(X)={xU|[x]BX}, RB¯X)={x∈ U|x]BXØ }.

1.1 广义决策多尺度信息系统

定义2[31]S=(U, C∪ {d})为一个具有多尺度决策的广义多尺度信息系统, 简称为广义决策多尺度信息系统, 其中,

(U, C)=(U, { ajk|k=1, 2, …, Ij; j=1, 2, …, M})

为一个广义多尺度信息系统, dC为具有n个尺度的决策属性, S也可表示为

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n}).

在广义决策多尺度信息系统

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

中, ajkUVjk为一个满射, Vjk为条件属性aj在第k个尺度下的值域.对于j∈ {1, 2, …, M}, 1≤ kIj-1, 存在一个满射 gjk, k+1VjkVjk+1, 使得

ajk+1= gjk, k+1􀳱 ajk,

ajk+1(x)= gjk, k+1( ajk(x)), xU,

gjk, k+1为条件属性aj的一个信息粒度变换, dtUVdt为一个满射, Vdt为决策属性d在第t个尺度下的值域.对于t∈ {1, 2, …, n-1}, 存在一个满射

hdt, t+1VdtVdt+1,

使得

dt+1= hdt, t+1􀳱dt,

dt+1(x)= hdt, t+1(dt(x)), xU,

hdt, t+1为决策属性d的一个信息粒度变换[11].

定义3[31]

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度信息系统, 若将条件属性aj(1≤ jM)限制在该属性的第ij(1≤ ijIj)尺度下, 则

K=(i1, i2, …, iM)

称为S的条件属性的一个尺度组合, 记S的条件属性尺度组合全体为K.若在此基础上将决策属性d限制在第t(1≤ tn)尺度下, 则

Q=(i1, i2, …, iM, t)

称为S的一个尺度选择.记S的尺度选择全体为Q, 则每个尺度选择

(i1, i2, …, iM, t)=Q∈ Q

形成一个单尺度决策表SQ=(U, CK∪ {dt}), 其中

CK={ a1i1, a2i2, …, amim}.

定义4 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度信息系统.对于两个尺度组合

K1=( i11, i21, …, im1)∈ K, K2=( i12, i22, …, im2)∈ K,

若对∀ j∈ {1, 2, …, M}, 都有 ij1ij2, 则称尺度组合K1K2细, 或K2K1粗, 记为K1K2.若K1K2, 且∃j∈ {1, 2, …, M}, 使得 ij1< ij2, 则称尺度组合K1严格细于K2, 或K2严格粗于K1, 记作K1K2.对于S的两个尺度选择

Q1=( i11, i21, …, im1, t1)∈ Q, Q2=( i12, i22, …, im2, t2)∈ Q,

若对∀ j∈ {1, 2, …, M}, 都有 ij1ij2, 且t2t1, 则称尺度选择Q1Q2细, 或Q2Q1粗, 记作Q1Q2; 若Q1Q2t2< t1或∃j∈ {1, 2, …, M}, 使得 ij1< ij2, 则称尺度选择Q1严格细于Q2, 或Q2严格粗于Q1, 记作Q1Q2.

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度信息系统, Q为S的尺度选择全体.对于

Q1=( i11, i21, …, im1, t1)∈ Q, Q2=( i12, i22, …, im2, t2)∈ Q,

定义

Q1Q2=( l11l12, l21l22, …, lm1lm2, t1t2),

Q1Q2=( l11l12, l21l22, …, lm1lm2, t1t2),

其中,

lj1lj2=Min{ l21, l22}, lj1lj2=Max{ l21, l22}, j{1, 2, …, M},

t1t2=Min{t1, t2}, t1t2=Max{t1, t2},

则可验证

Q1Q2Q1Q2=Q1Q1Q2=Q2.

且(Q, ≼, ∧ , ∨ )为一个有界格, 其中(1, 1, …, 1, n)为最小元, (I1, I2, …, IM, 1)为最大元.

1.2 序信息系统

定义5 称二元组(L, ⩽)为一个全序集, 其中LØ 称为标记集, ⩽为L上的二元关系, 满足

1)自反性.对于∀ xL, xx.

2)传递性.对于∀ xL, yL, zL, xy, yz蕴含xz.

3)⩽是线性序.对于∀ xL, yL, 或xy, 或yx.

定义6 对于2个全序集(L1, ⩽1)和(L2, ⩽2), 若映射

g∶ (L1, ⩽1)→ (L2, ⩽2),

对∀ lL1, sL1, 有

l1sg(l)⩽2g(s),

则称映射g为保序的.

不失一般性, 本文讨论序信息系统中的属性取值按照优先级递增排序.在信息系统S=(U, A)中, 若属性a的值域是全序集, 则称属性a为一个标准或准则.设aA为一个准则, 在a的值域Va上建立偏序关系⩾a, 对于xU, yU, ya x意为关于准则a, 对象y至少和对象x一样优, 或者说对象y支配对象x.若对于准则集BA, yB x, 意为对于∀ aB, ya x, 即对于B中的任意准则, 对象y至少和对象x一样优.

定义7[40]S=(U, A)为一个信息系统, 若S的条件属性集A={a1, a2, …, aM}中每个属性都是标准或准则, 则称S为一个序信息系统(Ordered InforMation SysteM, OIS).

在序信息系统中, 对于BA, 记

RB={(y, x)∈ U× U|a(y)⩾a(x), ∀ aB},

RBU上的优势关系.记

[x ]B={yU|a(y)⩾a(x), ∀ aB}={y∈ U|y, x)RB,

[x ]B为对象x关于属性子集B的优势类.记

U/ RB={[x ]B|xU},

U/ RB为属性子集B导出的优势类全体, 构成U上的一个覆盖.

对于X∈ P(U), BA, X关于优势关系 RB的下近似和上近似分别为[38, 39]

RB¯(X)={xU|[x ]BX}, RB¯X)={x∈ U|x ]BXØ }.

定义8[40]S=(U, A∪ {d})为一个序决策系统(Ordered Decision SysteM, ODS), 若S=(U, A)为一个序信息系统, 决策属性dA也是标准或准则, 记

Rd={(y, x)∈ U× U|d(y)⩾d(x)},

Rd为决策属性d导出的一个优势关系.记

[x ]d={yU|d(y)⩾d(x)}={y∈ U|y, x)Rd, xU,

[x ]d为在论域U上决策值至少和对象x一样优的对象的集合, 称为决策优势类.记

U/ Rd={[x ]dxU},

U/ Rd为决策优势类全体, 也构成U上的一个覆盖.称序决策系统S=(U, A∪ {d})为协调的, 若 RBRd; 否则, 称S=(U, A∪ {d})是不协调的.

1.3 证据理论

定义9[32]U为一个非空有限集合, 对于一个集合函数M∶ P(U)→ [0, 1], 若满足

M(Ø )=0, XP(U)M(X)=1,

则称M为一个Mass函数或一个基本概率指派.

对于一个集合X∈ P(U), 若M(X)> 0, 则称X为函数M的一个焦元.记

M={X∈ P(U)|M(X)> 0}

M的全体焦元构成的集合, 则称序对(M, M)为U上的一个信任结构.

任何一个信任结构可导出一对信任函数与似然函数.

定义10[32] 设(M, M)为U上的一个信任结构, 在U上定义信任函数Bel∶ P(U)→ [0, 1]和似然函数Pl∶ P(U)→ [0, 1]如下:

Bel(X)= YØYXM(Y), ∀ X∈ P(U), Pl(X)= YYXØ(Y), ∀ X∈ P(U).

可验证, 信任函数和似然函数是对偶的, 即

Bel(X)=1-Pl(~X), Pl(X)=1-Bel(~X),

其中~XXU中的补集.

粗糙集理论和D-S证据理论之间具有较强的联系, 已证实, 信息系统中每个属性子集导出的集合的下近似概率与上近似概率分别为该集合在某个信任结构下的信任度与似然度.

定理1[33]S=(U, A)为一个信息系统, 对于∀ X∈ P(U), BA, 记

BelB(X)=P RB¯(X), PlB(X)=P RB¯(X).

其中,

P(X)= XU,

|X|为X的基数, 则

Bel∶ P(U)→ [0, 1], Pl∶ P(U)→ [0, 1]

分别为U上的信任函数与似然函数, 对应的Mass函数为:

MB(X)= P(X), XU/RB0, XU/RB

2 广义决策多尺度序信息系统
2.1 基本概念

定义11 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度信息系统, 若对于

Q1=(1, 1, …, 1)∈ Q, SQ1(U, CK1{d1})

为一个序决策系统, 且对于每个条件属性aj(j∈ {1, 2, …, M})和每个尺度k∈ {1, 2, …, Ij-1}, 条件属性aj(j∈ {1, 2, …, M})的信息粒度变换 gjk, k+1(k∈ {1, 2, …, Ij-1})都是保序的, 且对于决策属性d和每个尺度t∈ {1, 2, …, n-1}, 决策属性d的信息粒度变换 hdt, t+1也都是保序的, 则称S为一个决策多尺度序信息系统.

由定义11知, 只要

SQ1=(U, CK1∪ {d1})

为序决策系统, 且条件属性的信息粒度变换和决策属性的信息粒度变换都是保序的, 则对于S的任意一个尺度选择

Q=(K, t)∈ Q, K∈ K,

对应的决策系统

SQ=(U, CK∪ {dt})

都是一个序决策系统.

定义12 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

K=(i1, i2, …, iM)∈ K,

RCK={(y, x)∈ U× U| ajij(y)⩾ ajij(x), ∀ ajijCK},

RCK是由CK导出的优势关系.记

[x ]CK={yU| ajij(y)⩾ ajij(x), ∀ ajijCK}={y∈ U|y, x)RCk, xU,

[x ]CK为对象x关于优势关系 RCK的优势类.记

U/ RCK={[x ]CK|xU},

U/ RCKU上由优势关系 RCK导出的优势类全体.

对于∀ X∈ P(U), X关于 RCK的下近似 RCK¯(X)与上近似 RCK¯(X)定义如下:

RCK¯(X)={x∈ U|[x ]CK⊆X}, RCK¯X)={x∈ U|x ]CKX≠ Ø }.

类似于文献[20], 可证明命题1成立.

命题1 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

X∈ P(U), Y∈ P(U), K∈ K, Q=(K, t)∈ Q,

则如下性质成立:

1) RCK¯(X)=~ RCK¯(~X),

RCK¯(X)=~ RCK¯(~X).

2) RCK¯(Ø )= RCK¯(Ø )=Ø ,

RCK¯(U)= RCK¯(U)=U.

3) RCK¯(XY)= RCK¯(X)∩ RCK¯(Y),

RCK¯(XY)= RCK¯(X)∪ RCK¯(Y).

4) RCK¯(XY)⊇ RCK¯(X)∪ RCK¯(Y),

RCK¯(XY)⊆ RCK¯(X)∩ RCK¯(Y).

5) RCK¯(X)⊆XRCK¯(X).

6)若XY, 则

RCK¯(X)⊆ RCK¯(Y), RCK¯(X)⊆ RCK¯(Y).

7) RCK¯(X)= RCK¯RCK¯(X),

RCK¯(X)= RCK¯RCK¯(X).

8)若K'∈ K, KK', 则

RCK'¯(X)⊆ RCK¯(X), RCK¯(X)⊆ RCK'¯(X).

9)若记

KMin=(1, 1, …, 1)∈ K, KMax=(I1, I2, …, IM)∈ K,

则对于∀ K∈ K, 有

RCKMax¯(X)⊆ RCK¯(X)⊆ RCKMin¯(X), RCKMin¯X)RCK¯X)RCKMax¯X).

定义13 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

xU, K∈ K, Q=(K, t)∈ Q,

Rdt={(y, x)∈ U× U|dt(y)⩾dt(x)},

Rdt为决策属性d在第t个尺度上导出的优势关系.记

[x ]dt={y∈ U|dt(y)⩾dt(x)}= {y∈ U|y, x)∈ Rdt,

[x ]dt为对象x关于优势关系 Rdt的优势决策类.记

U/ Rdt={[x ]dt|xU},

U/ RdtRdt导出的全体优势决策类.

xU, [x ]dt关于条件属性集CK的下近似和上近似分别为

RCK¯([x ]dt)={y∈ U|[y ]CK⊆[x ]dt}, RCK¯[x ]dt={y∈ U|y ]CK[x ]dtØ }.

决策属性dt关于 RCK的正域Po sCK(dt)和分类精度r(CK, dt)分别定义如下:

Po sCK(dt)= [x]dtU/RdtRCK¯(X), r(CK, dt)= PosCK(dt)U.

类似于文献[20], 可得命题2.

命题2 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, 对于

xU, K∈ K, K'∈ K, KK',

1) RCK¯([x ]dt)⊆[x ]dtRCK¯([x ]dt),

2) RCK¯([x ]dt)=~ RCK¯(~[x ]dt),

3) RCK'¯([x ]dt)⊆ RCK¯([x ]dt),

RCK¯([x ]dt)⊆ RCK'¯([x ]dt),

4) RCK¯([x ]dt)⊆ RCK¯([x ]dt+1),

RCK¯([x ]dt)⊆ RCK¯([x ]dt+1),

t∈ {1, 2, …, n-1},

5)Po sCK'(dt)⊆Po sCK(dt),

r(CK', dt)≤ r(CK, dt),

6)Po sCK(dt)⊆Po sCK(dt+1),

r(CK, dt)≤ r(CK, dt+1),

t∈ {1, 2, …, n-1},

7)若KMin=(1, 1, …, 1)∈ K,

KMax=(I1, I2, …, IM)∈ K,

则对于∀ K∈ K, 都有

r( CKMax, dt)≤ r(CK, dt)≤ r( CKMin, dt).

2.2 证据理论

类似于文献[44]和文献[45]可得, 广义决策多尺度序信息系统中每个尺度组合下集合的下近似集与上近似集的概率一定是某个信任结构下该集合的信任度与似然度.

定理2 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, K∈ K, 对于X∈ P(U), 记

BelCK(X)=P RCK¯(X), PlCKX)=P RCK¯X)

BelCK∶ P(U)→ [0, 1], PlCK∶ P(U)→ [0, 1]

分别为U上一对对偶的信任函数与似然函数, 对应的Mass函数为:

mCK(X)= hCK(X)U, XU/RCK0, XU/RCK

其中,

hCK(X)={xU|[x ]CK=X}, X∈ P(U).

推论1 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, 对于K1∈ K, K2∈ K, K1K2, 则对于∀ X∈ P(U), 信任函数 BelCK和似然函数 PlCK满足:

BelCK2(X)≤ BelCK1(X)≤ XUPlCK1(X)≤ PlCK2(X).

3 协调广义决策多尺度序信息系统的尺度选择

尺度选择是从多尺度信息系统中知识获取的一个关键步骤, 在广义决策多尺度序信息系统中, 寻找最优尺度选择的目的是从系统中选择一个合适的单尺度序决策系统, 用于最终的决策规则提取.

3.1 广义决策多尺度序信息系统的尺度选择

定义14 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

K1=(1, 1, …, 1)∈ K

为条件属性集C的最细尺度组合.对于t∈ {1, 2, …, n}, 若 RCK1Rdt, 则称S关于决策属性dt是协调的.若 RCK1Rdn, 即S关于最粗尺度的决策属性dn是协调的, 则称S是协调的; 否则, 称S是不协调的.

定义15 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, 对于

K=(i1, i2, …, iM)∈ K,

对应一个具有多尺度决策的单尺度信息系统

SK=(U, CK∪ {d})=(U, { a1i1a2i2…, aMiM∪ {dt|=|1, 2, …, n}).

对于t∈ {1, 2, …, n}, 若 RCKRdt, 则称SK关于决策属性dt是协调的.若 RCKRdn, 即SK关于最粗尺度对应的决策属性dn是协调的, 则称SK是协调的; 否则称SK是不协调的.

定理3 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, K∈ K, K'∈ K, 若KK', 且SK'是协调的, 则SK也是协调的.

证明 一方面, 由于SK'=(U, CK'∪ {d})是协调的, 因此 RCK'Rdn.另一方面, 由KK'可知 RCKRCK', 从而 RCKRdn, 故由定义15知,

SK=(U, CK∪ {d})

也是协调的. 证毕.

定理4 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

Q1=(K1, t1)∈ Q, Q2=(K2, t2)∈ Q, Q1Q2,

若序决策系统 SQ2是协调的, 则 SQ1也是协调的.

证明 由于 SQ2=(U, CK2∪ { dt2})是协调的, 因此 RCK2Rdt2, 又由于Q1Q2, 即K1K2, 且t2t1, 从而 RCK1RCK2, 且 Rdt2Rdt1, 于是 RCK1Rdt1, 即 SQ1是协调的. 证毕.

定义16 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统, 对于

Q=(K, t)∈ Q,

若满足

1)SQ是协调的, 即 RCKRdt;

2)对任意满足QQ'Q'=(K', t')∈ Q, SQ'是不协调的, 即 RCK'Rdt'.

则称Q=(K, t)为S的一个最优尺度选择, 并称

SQ=(U, CK∪ {dt})

S的一个最优协调序决策系统.

由定义16可见, 一个协调广义决策多尺度序信息系统S=(U, C∪ {d})的一个最优尺度选择

Q=(K, t)∈ Q

是Q中使SQ是协调的最粗的尺度选择, 因此, 寻求协调广义决策多尺度序信息系统的一个最优尺度选择问题可转化为求以下最优解问题:

Max j=1mij-t, s.t. RCKRdtK=(i1, i2, , iM), 1≤ ijIj, 1≤ t≤ n.

满足上述最优解问题的一个尺度选择Q就是S的一个最优尺度选择.

定义17 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统, K1=(1, 1, …, 1)∈ K, Q=(K, t)∈ Q,

1)若对于∀ xU, 有 RCK¯([x ]dt)= RCK1¯([x ]dt), 则称SQ关于S是下近似协调的; 若SQ关于S是下近似协调的, 且对于任意满足QQ'Q'=(K', t')∈ Q, ∃yU, 使得 RCK'¯([y ]dt')≠ RCK1¯([y ]dt), 即SQ'关于S不是下近似协调的, 则称Q=(K, t)是S的一个下近似最优尺度选择.

2)若对于∀ xU, 都有 RCK¯([x ]dt)= RCK1¯([x ]dt), 则称SQ关于S是上近似协调的; 若SQ关于S是上近似协调的, 且对于任意满足QQ'Q'=(K', t')∈ Q, ∃yU, 使得 RCK'¯([y ]dt')≠ RCK1¯([y ]dt), 即SQ'关于S不是上近似协调的, 则称Q=(K, t)是S的一个上近似最优尺度选择.

定义18 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

K1=(1, 1, …, 1)∈ K, Q=(K, t)∈ Q,

1)若对于∀ xU, 都有

Be lCK([x ]dt)= BelCK1([x ]dt),

则称SQ关于S是信任协调的; 若SQ关于S是信任协调的, 且对于任意满足QQ'

Q'=(K', t')∈ Q,

yU, 使得Be lCK'([y ]dt')≠ BelCK1([y ]dt),

SQ'关于S不是信任协调的, 则称Q=(K, t)是S的一个信任最优尺度选择.

2)若对于∀ xU, 都有P lCK([x ]dt)=P lCK1([x ]dt),

则称SQ关于S是似然协调的; 若SQ关于S是似然协调的, 且对于任意满足QQ'Q'=(K', t')∈ Q,

yU, 使得

P lCK'([y ]dt')≠ P lCK1([y ]dt),

SQ'关于S不是似然协调的, 则称Q=(K, t)是S的一个似然最优尺度选择.

定理5 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

Q=(K, t)∈ Q,

1)SQ关于S是下近似协调的当且仅当SQ关于S是信任协调的.

2)QS的下近似最优尺度选择当且仅当QS的信任最优尺度选择.

3)SQ关于S是上近似协调的当且仅当SQ关于S是似然协调的.

4)QS的上近似最优尺度选择当且仅当QS的似然最优尺度选择.

证明 先证1).充分性.设SQ关于S是下近似协调, 则对∀ xU, 有

RCK¯([x ]dt)= RCK1¯([x ]dt),

从而

P RCK¯([x ]dt)=P RCK1¯([x ]dt),

Be lCK([x ]dt)=Be lCK1([x ]dt),

因此, SQ关于S是信任协调的.

必要性.若SQ关于S是信任协调的, 则对∀ xU,

BelCK([x ]dt)=Be lCK1([x ]dt),

|RCK¯([x]dt)|U= |RCK1¯([x]dt)|U.

又由于

RCK¯([x ]dt)⊆ RCK1¯([x ]dt),

于是可得

RCK¯([x ]dt)= RCK1¯([x ]dt),

因此, SQ关于S是下近似协调的.

再证2).由结论1)即得.

再证3)充分性.设SQ关于S是上近似协调的, 则对于∀ xU, 有

RCK¯([x ]dt)= RCK1¯([x ]dt),

从而

P RCK¯([x ]dt)=P RCK1¯([x ]dt),

P lCK([x ]dt)=P lCK1([x ]dt),

因此, SQ关于S是似然协调的.

必要性.若SQ关于S是似然协调的, 则对于∀ xU, 有P lCK([x ]dt)=P lCK1([x ]dt), 即 |RCK¯([x]dt)|U= |RCK1¯([x]dt)|U,

又由于 RCK¯([x ]dt)⊆ RCK1¯([x ]dt), 于是可得 RCK¯([x ]dt)= RCK1¯([x ]dt), 因此, SQ关于S是上近似协调的.

最后证明4).由结论3)即得. 证毕.

定理6 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

Q=(K, t)∈ Q,

SQ是协调的当且仅当SQ关于S是信任协调的.

证明 充分性.设SQ是协调的, 则∀ xU, 有

[x ]CK⊆[x ]dt.

由命题1知,

RCK¯([x ]dt)⊆[x ]dt

成立, 对于∀ y∈ [x ]dt, 由[x ]dt的定义可知, 有

[y ]dt⊆[x ]dt.

由于SQ关于S是协调的, 即[y ]CK⊆[y ]dt, 从而[y ]CK⊆[x ]dt, 即yRCK¯([x ]dt), 故有

[x ]dtRCK¯([x ]dt),

这样就证明

RCK¯([x ]dt)=[x ]dt.

又由于K1=(1, 1, …, 1)是最细的尺度组合, 因此

[x ]CK1⊆[x ]CK,

从而

[x ]CK1⊆[x ]dt,

即序决策系统 S(K1, t)也是协调的, 从而也有

RCK1¯([x ]dt)=[x ]dt

成立, 于是

RCK¯([x ]dt)= RCK1¯([x ]dt),

再由定理5知

Be lCK([x ]dt)=Be lCK1([x ]dt),

SQ关于S是信任协调的.

必要性.设SQ是关于S信任协调的, 由定理5知, 对于∀ xU, 有

RCK¯([x ]dt)= RCK1¯([x ]dt).

反证, 假如SQ是不协调的, 即 RCKRdt, 则∃y∈ U, 使得[y ]CK⊈[y ]dt.因为S是协调的, 因此, [y ]CK1⊆[y ]dt, 从而由下近似定义知y∈ RCK1¯([y ]dt), 于是由条件得y∈ RCK¯([y ]dt), 即[y ]CK⊆[y ]dt, 矛盾.因此, SQ是协调的. 证毕.

定义19 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

K1=(1, 1, …, 1)∈ K,

对于t∈ {1, 2, …, n}, S的信任和Mt与似然和Nt分别定义为

Mt= DU/RdtBelCK1(D), Nt= DU/RdtPlCK1D).

其中,

U/ Rdt={[x ]dt|x∈ U}

为决策属性d在第t个尺度下决策优势类全体.

定理7 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

Q=(K, t)∈ Q,

1)SQ是协调的当且仅当

DU/RdtBe lCK(D)=Mt;

2)Q=(K, t)∈ Q为S的最优尺度选择当且仅当

DU/RdtBe lCK(D)=Mt,

且对任意满足QQ'

Q'=(K', t)∈ Q,

DU/RdtBe lCK'(D)< Mt.

证明 由定理6和推论1即证明1).由结论1)即证明2). 证毕.

定理8 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统, Q=(K, t)∈ Q,

1)SQ是似然协调的当且仅当 DU/RdtPlCK(D)=Nt;

2)Q=(K, t)∈ Q是S的似然最优尺度选择当且仅当 DU/RdtPlCK(D)=Nt, 且对任意满足QQ'Q'=(K', t)∈ Q, 有 DU/RdtPlCK'(D)> Nt.

证明 类似于定理7的证明. 证毕.

由上述结论可见, 保持序决策系统是协调的最粗尺度选择(即最优尺度选择)与下近似最优尺度选择和信任最优尺度选择都是等价的, 而上近似最优尺度选择与似然最优尺度选择也是等价的.因此, 定义16~定义18给出的5种类型的最优尺度选择概念实际上只有2种不同的类型.

3.2 示例

例1 表1为一个广义决策多尺度序信息系统

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n}),

其中,

U={x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12}, C={a1, a2}.

条件属性a1a2都有3个尺度, 决策属性d有2个尺度.条件属性a1a2和决策属性

d={dt|t=1, 2}

的信息粒度变换分别如下.对于xU:

1) gj1, 2Va1jVa2j, gj1, 2aj1x))= B, aj1(x){9, 10}C, aj1(x){7, 8}D, aj1(x){5, 6}E, aj1(x){3, 4}j=1, 2;

2) gj2, 3Va2jVa3j, gj2, 3( aj2(x))= N, aj2(x){B, C}M, aj2(x){D}K, aj2(x){E}j=1, 2;

3)h1, 2Vd1Vd2, h1, 2(d1(x))= B, d1(x){9, 10}C, d1(x){7, 8}D, d1(x){5, 6}E, d1(x){3, 4}

其中, 数值型值域 Va1jVd1按自然顺序排序, 条件属性值域 Va2j, Va3j和决策属性值域 Vd2上的全序关系分别为

B> C> D> E, N> M> K.

表1 一个广义决策多尺度序信息系统 Table 1 A generalized decision Multi-scale ordered inforMation systeM

图1为S的全体尺度选择的格结构.

图1 尺度选择的格结构Fig.1 Lattice structure of scale selections

1)判断S是否是协调的; 2)确定S的最优尺度选择; 3)确定S的上近似最优尺度选择、下近似最优尺度选择、信任最优尺度选择和似然协调最优尺度选择.

解:1)对于K1=(1, 1), 即 CK1={ a11, a21}, 经计算可得

[x1 ]CK1={x1, x12},

[x2 ]CK1{x1, x2, x12},

[x3= ]CK1x1, x2, x3, x7, x12},

[x4={ ]CK11, x4, x7, x8, x11},

[x5={x ]CK1, x7, x8, x12},

[x6={x1 ]CK1x5, x6, x7, x8, x9, x12}=[x9,

[x7 ]CK1={x7},

[x8 ]CK1{x7, x8, x12},

[x10= ]CK1x1, x5, x6, x7, x8, x9, x10, x12},

[x11={ ]CK11, x4, x5, x6, x7, x8, x9, x11, x12},

[x12={x ]CK12},

U/ RCK1={{x1, x12}, {x1, x2, x12}, {x1, x2, x3, x7, x12},

{x1, x4, x7, x8, x11}, {x5, x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x12}, {x7}, {x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x10, x12},

{x1, x4, x5, x6, x7, x8, x9, x11, x12}, {x12}}.

对于d1, 有

[x1 ]d1={x1, x7, x8, x12}=[x8 ]d1,

[x2 ]d1{x1, x2, x4, x5, x7, x8, x12}=[x4 ]d1[x5 ]d1,

[x3 ]d1={x1, x2, x3, x4, x5, x6, x7, x8, x9, x12}=[x6 ]d1=[x9 ]d1,

[X7 ]d1={x7, x12}=[x12 ]d1

[x10 ]d1={x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12}=U=[x11 ]d1,

U/ Rd1={{x1, x7, x8, x12}, {x1, x2, x4, x5, x7, x8, x12}, U, {x7, x12}, {x1, x2, x3, x4, x5, x6, x7, x8, x9, x12}}.

对于d2, 有

[x1 ]d2={x1, x2, x4, x5, x7, x8, x12}=[x2 ]d2= [x4 ]d2[x5 ]d2[x8 ]d2,

[x3 ]d2={x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12}=

U=[x6 ]d2=[x9 ]d2=[x10 ]d2=[x11 ]d2,

[x7 ]d2={x7, x12}=[x12 ]d2,

U/ Rd2={{x1, x2, x4, x5, x7, x8, x12}, {x7, x12}, U}.

易见U/ RCK1U/ Rd2, 因此S是协调的.

2)设K2=(1, 2), 即 CK2={ a11, a22}, 经计算有

U/ RCK2={{x1, x12}, {x1, x2, x12}, {x1, x2, x3, x7, x12},

{x1, x2, x4, x7, x8, x12}, {x1, x5, x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x12}, {x7},

{x1, x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x10, x12},

{x1, x2, x4, x5, x6, x7, x8, x9, x11, x12}},

因此

U/ RCK2U/ Rd1, U/ RCK2U/ Rd2.

K3=(2, 1), 即 CK3={ a12, a21}, 经计算有

U/ RCK3={{x1, x12}, {x1, x2, x12},

{x1, x2, x3, x4, x7, x8, x12}, {x1, x4, x7, x8, x12},

{x5, x7, x8, x12}, {x1, x5, x6, x7, x8, x9, x12},

{x7}, {x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x10, x12},

{x1, x4, x5, x6, x7, x8, x9, x11, x12}, {x12}},

因此

U/ RCK3U/ Rd2, U/ RCK3U/ Rd1.

K4=(2, 2), 即 CK4={ a12, a22}, 经计算有

U/ RCK4={{x1, x12}, {x1, x2, x12},

{x1, x2, x3, x4, x7, x8, x12},

{x1, x2, x4, x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x12}, {x7},

{x1, x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x10, x12},

{x1, x2, x4, x5, x6, x7, x8, x9, x11, x12}},

因此

U/ RCK4⊈U/ Rd1, U/ RCK4⊈U/ Rd2,

所以S有唯一的最优尺度选择(2, 1, 1).

3)求S的下近似最优尺度选择.只需验证当t=1时的情况即可, 对于K1=(1, 1), 即 CK1={ a11, a21}, 经计算有

RCK1¯x1d1=x1, x7, x8, x12=RCK1¯x8d1,

RCK1¯x2d1=x1, x2, x4, x5, x7, x8, x12=RCK1¯x4d1=RCK1¯x5d1,

RCK1¯x3d1=x1, x2, x3, x4, x5, x6, x7, x8, x9, x12=RCK1¯x6d1=RCK1¯x9d1,

RCK1¯x7d1=x7, x12=RCK1¯x12d1,

RCK1¯x10d1=x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12=U=RCK1¯x11d1,

对于K2=(1, 2), 即 CK2={ a11, a22}, 经计算对于x7, 有

RCK2¯([x7 ]d1)≠ RCK1¯([x7 ]d1),

且对于x12, 有

RCK2¯([x12 ]d2)≠ RCK1¯([x12 ]d2).

对于K3=(2, 1), 即 CK3={ a12, a21}, 经计算对∀ xU, 有

RCK3¯([x ]d1)= RCK1¯([x ]d1)

成立.

对于K4=(2, 2), 即 CK4={ a12, a22}, 经计算对x7, 有

RCK4¯([x7 ]d1)≠ RCK1¯([x7 ]d1),

且对于x12, 有

RCK4¯([x12 ]d2)≠ RCK1¯([x12 ]d2).

所以S有唯一的下近似最优尺度选择(2, 1, 1).

S的上近似最优尺度选择.当t=1时, 对于K1=(1, 1), 即 CK1={ a11, a21}, 经计算有

RCK1¯x1d1=U=RCK1¯x8d1,

RCK1¯x2d1=U=RCK1¯x4d1=RCK1¯x5d1,

RCK1¯x3d1=U=RCK1¯x6d1=RCK1¯x9d1,

RCK1¯x7d1=U=RCK1¯x12d1,

RCK1¯x10d1=U=RCK1¯x11d1,

对于K2=(1, 2), 则 CK2={ a11, a22}, 经计算对于∀ xU, 有

RCK2¯([x ]d1)= RCK1¯([x ]d1).

同理, 对于K9=(3, 3), 即 CK9={ a13, a23}, 经计算对于∀ xU, 有

RCK9¯([x ]d1)= RCK1¯([x ]d1),

所以(3, 3, 1)是S的上近似最优尺度选择.

S的信任最优尺度选择.当t=1时,

DURd1BelCK1D=4+2+7+10+1212=3512

DURd1BelCK2D=4+1+7+10+1212=3412< 3512

DURd1BelCK3D=4+2+7+10+1212=3512

DURd1BelCK4D=4+1+6+10+1212=3312< 3512

t=2时,

DURd2BelCK1D=2+7+1212=2112

DURd2BelCK2D=1+7+1212=2012< 2112

DURd2BelCK3D=2+7+1212=2112

DURd2BelCK4D=1+6+1212=1912< 2112

因此, (2, 1, 1)为S的信任最优尺度选择.

S的似然最优尺度选择.由于(3, 3, 1)是S的上近似最优尺度选择, 只需验证K9=(3, 3)和t=1时即可.

DU/Rd1PlCK1(D)=1+1+1+1+1=5,

DU/Rd1PlCK9(D)=1+1+1+1+1=5,

DU/Rd1PlCK1(D)= DU/Rd2PlCK9(D),

(3, 3, 1)为S的似然最优尺度选择.

对于S, (2, 1, 1)为最优尺度选择、下近似最优尺度选择和信任最优尺度选择, (3, 3, 1)为上近似最优尺度选择和似然最优尺度选择.

4 协调广义决策多尺度序信息系统的约简与规则提取
4.1 广义决策多尺度序信息系统的约简

定义20 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

K∈ K, Q=(K, t)∈ Q, RCKRdt,

若对于BC, 有 RBKRdt, 则称BSQ-尺度协调集.若BSQ-尺度协调集, 且对于∀ AB, 都有 RAKRdt, 则称BS的一个Q-尺度约简.

定理9 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

K1∈ K, K2∈ K, K1≺K2, Q1=(K1, t)∈ Q, Q2=(K2, t)∈ Q.

BSQ2-尺度协调集, 则BS的一个Q1-尺度协调集.

证明 由定义20与定理3可证. 证毕.

定义21 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

K=(i1, i2, …, iM)∈ K, Q=(K, t)∈ Q,

定义

Dt={(x, y)∈ U× U|dt(x)< dt(y)},

DdtK(x, y)= {ajijCK|(x, y)R{ajij}}, (x, y)DtØ, (x, y)Dt

DdtK=( DdtK(x, y)|x, yU),

其中

R{ajij}={(x, y)∈ U× U| ajij(x)⩾ ajij(y)} ,

DdtK(x, y)是对象x, y在尺度组合K下关于决策属性dt的可辨识属性集, DdtK为协调广义决策多尺度序信息系统S在尺度选择Q下的可辨识矩阵.

定义22 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

BC, K∈ K, Q=(K, t)∈ Q,

定义

ΔdtK= (x, y)U×U(∨ DdtK(x, y))

S在尺度选择Q上的可辨识函数, 其中, ∧ 为合取, ∨ 为析取.

类似于文献[37]~文献[39], 将上式给出的合取式转化为极小析取范式, 则该极小析取范式中每个合取式中的属性集合就是系统的一个Q-尺度约简.

4.2 广义决策多尺度序信息系统的序决策规则

获取

本节在最优尺度选择约简的基础上给出蕴含在广义决策多尺度序信息系统中的序决策规则.

定义23 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, 对于BC,

K=(i1, i2, …, iM)∈ K, ajijBK,

Vjij为属性aj在第ij尺度下的值域, vajijVjij, 称( ajij, ⩾, vajij)为S在第ij尺度下的一个B-原子性质或B-原子公式.任何一个B-原子性质或几个B-原子性质的合取称为在尺度组合K下的一个B-描述子.原子公式( ajij, ⩾, vajij)的支持对象表示如下:

(ajij, , vajij)={x∈ U| ajij(x)⩾ vajij}.

蕴含在决策信息系统中的命题知识可使用决策规则的形式表示: ts, 其中, t为规则的前件, s为规则的后件, 表示由t可得出s.对同时满足规则的前件和后件的对象, 称为支持这条规则.

对于协调广义决策多尺度序信息系统, 结合原子公式的概念, 类似于Greco等[37, 38, 39]提出序决策规则, 可得蕴含在系统中基于优势关系的确定性序决策规则如下:

( a1i1, ⩾, va1i1)∧ ( a2i2, ⩾, va2i2)∧ …∧ ( amim, vamim(dt, , vdt).

例2 (接例1) 由于S的最优尺度选择为Q=(2, 1, 1), 则可得到在尺度选择QS的可辨识矩阵如表2所示.

由于

ΔK3d1= (x, y)U×U(∨ DK3d1(x, y))= a12a21,

于是, S在尺度选择Q=(2, 1, 1)下唯一的属性约简为{ a12, a21}.因此可得到SQ=(2, 1, 1)下确定性

序决策规则如下:

r1K3:( a12, ⩾, C)∧ ( a21, ⩾, 7)→ (d1, ⩾, 8),

该规则支持的对象为x1, x7, x8, x12.

r2K3:( a12, ⩾, C)∧ ( a21, ⩾, 5)→ (d1, ⩾, 7),

该规则支持的对象为x1, x2, x4, x5, x7, x8, x12.

r3K3:( a12, ⩾, D)∧ ( a21, ⩾, 4)→ (d1, ⩾, 6),

该规则支持的对象为x1, x2, x3, x4, x5, x6, x7, x8, x9, x12.

r4K3:( a12, ⩾, E)∧ ( a21, ⩾, 4)→ (d1, ⩾, 5),

该规则支持的对象为U.

表2 尺度选择QS的可辨识矩阵 Table 2 Discernibility Matrix of S under scale selection Q
5 结束语

最优尺度选择是多尺度信息系统知识获取的一个关键步骤, 最优尺度选择的作用是从多尺度信息系统中找到一个符合目标条件的最优子表用于最终的决策(如聚类、分类或排序).本文针对协调广义决策多尺度序信息系统中的知识获取问题, 分别使用粗糙集理论和证据理论定义下近似最优尺度选择与上近似最优尺度选择、信任最优尺度选择与似然最优尺度选择的概念, 证明保持序决策系统是协调的最粗尺度选择(即最优尺度选择)与下近似最优尺度选择和信任最优尺度选择都是等价的, 而上近似最优尺度选择与似然最优尺度选择也是等价的.并在最优尺度选择基础上, 进一步使用粗糙集辨识矩阵方法给出属性约简, 最终获得蕴含在协调广义决策多尺度序信息系统中的序决策规则集.在后续研究中:一方面, 可进一步研究在协调和不协调广义决策多尺度序信息系统中局部最优尺度选择及规则提取问题; 另一方面, 其它更复杂数据类型(如不完备广义决策多尺度序信息系统等)的最优尺度选择及序决策规则提取也是值得研究的问题.

粒计算(Granular CoMPuting, GrC) [1, 2, 3, 4]是人工智能领域活跃的研究方向之一.它模拟人类问题思考模式, 以粒(Granule)为基本计算单位, 通过信息粒化等手段达到简化复杂问题求解的主要目标.粒计算的研究主要集中在粒的描述、表示与构造, 粒的多层次合成与分解, 具有多层次或多粒度结构数据的信息粒的变换、最优粒度或尺度的选择, 蕴含在数据集上的粒与粒之间的IF-THEN规则的提取, 以及粒结构的不确定性分析等.目前, 粒计算已成为大数据挖掘与决策分析的一种重要研究方法[5, 6, 7, 8, 9].

粗糙集[10]是推动和发展粒计算研究的一个重要数据分析模型, 它以各种各样的信息系统(InforMation SysteMs)或决策系统(Decision SysteMs)为数据分析对象, 通过定义在数据样本集上的二元关系构造“ 粒” , 粒化论域或样本空间, 并通过属性约简方法挖掘蕴含在数据集上的决策规则集.传统粗糙集数据分析呈现的数据集大都是单尺度形式的, 即信息系统中每个对象在每个属性上只取唯一的值.然而, 在实际生活中, 人们可能需要在多粒度或多尺度环境下处理和分析数据, 要在不同尺度下对同一对象在同一属性下的数据进行观察、分析并做出相应决策.为此, Wu等[11]提出多尺度粗糙集数据分析模型, 处理的数据集称为多尺度信息系统, 系统中的每个对象在同个属性下根据不同的尺度呈现不同标记的值, 并且从细尺度的属性值到粗尺度的属性值都有相应的信息粒度变换.这种数据处理模型又称为Wu-Leung模型[12].在该模型中, 较细尺度对应的数据所含信息较详细, 但是意味着获取信息成本较高, 而较粗尺度对应的数据所含信息较少, 获取信息成本也较低.在实际问题研究中, 选取合适尺度去解决问题就显得至关重要.多尺度粗糙集数据分析的核心思想是:根据决策目标, 对每个属性选择一个合适的尺度或粒度(称为最优尺度), 构成一个新的单尺度信息系统, 再在保持相同目标约束要求下使用粗糙集方法给出属性约简, 做出最终的决策(如分类、聚类或排序决策等).因此, 多尺度信息系统或多尺度决策系统中的最优尺度选择是从该类数据集上获取知识的关键步骤, 现已成为多尺度粗糙集数据分析的一个重要研究方向[13, 14, 15, 16, 17, 18, 19, 20, 21].

经典Wu-Leung模型的一个基本假设是数据集上所有属性具有相同的尺度个数, 并且在数据分析时只能取同层尺度.然而在实际问题中, 数据集上不同属性可能具有不同的尺度个数, 为此, Li等[12]引入尺度组合的概念, 提出广义多尺度信息系统的知识获取模型.近年来, 针对各类广义多尺度信息系统的最优尺度组合及知识获取的研究受到相关研究人员的关注, 并取得重要进展[22, 23, 24, 25, 26, 27, 28, 29, 30].由于Li等[12]提出的广义多尺度决策表的决策属性是单尺度的, 在实际应用中, 同一对象的决策属性也可能根据不同尺度取不同的值.为此, Huang等[31]提出决策属性也是多尺度的广义多尺度信息系统(简称为广义决策多尺度信息系统)的数据分析模型, 研究协调广义决策多尺度信息系统的最优尺度选择方法.

证据理论, 又称DeMPster-Shafer证据理论[32](简称D-S证据理论), 是处理不精确和不确定性问题的数学工具之一.它的核心思想是通过由信任结构导出的一对信任函数与似然函数刻画概念的不确定性.粗糙集理论的下近似集与上近似集和证据理论的信任测度与似然测度可分别看作是对同个不确定概念(集合)的定性和定量不确定性表示, 因此, 两个理论具有很强的关联性.相关研究已证实, 由粗糙近似空间导出的集合的下近似概率和上近似概率一定是某个信任结构下的信任测度与似然测度, 反之, 任给一个信任结构及其导出的信任函数与似然函数, 一定可表示为某个粗糙近似空间下的下近似概率和上近似概率[33, 34, 35].基于这两个理论之间的关系, 学者们提出利用证据理论进行粗糙集数据分析, 取得很多重要成果[36].近几年, 使用证据理论刻画多尺度环境下的最优尺度选择也取得一些研究进展.

众所周知, 多属性决策或排序是粗糙集数据分析中一类重要的研究问题, 也是现实生活中较常见的数据处理问题.Greco等[37, 38, 39]定义序信息系统中属性(在序信息系统中又称为准则)子集导出的优势关系, 提出基于优势关系的粗糙集方法(DoMi-nance-Based Rough Set APProach, DRSA), 解决序信息系统或序决策系统的序IF-THEN规则的提取或排序问题.随后, 针对不同数据类型的DRSA也相继被提出[40, 41, 42, 43].Xu等[44]使用证据理论的信任函数与似然函数, 研究序信息系统的属性约简问题, 而Du等[45]使用证据理论的信任函数与似然函数, 讨论序决策系统的属性约简问题.

近年来, 针对多尺度环境下信息系统的多属性决策、排序等问题已受到相关领域研究人员的关注[46, 47, 48].Zheng等[20]研究Wu-Leung模型下多尺度序信息系统的最优尺度选择问题, 使用证据理论中的信任函数与似然函数等价刻画协调和不协调多尺度序决策系统中下近似最优尺度和上近似最优尺度的特征.

尽管多尺度环境下很多数据类型的最优尺度选择和知识获取方面的研究取得重要进展, 但迄今未有学者对决策属性也是多尺度的多尺度序信息系统(称为决策多尺度序信息系统)的知识获取方面展开研究.本文在文献[20]和文献[31]基础上, 探索研究协调决策多尺度序信息系统的最优尺度选择及其相应的序决策规则提取问题.

1 基本知识

在本文中, 对于给定的非空有限集合U={x1, x2, …, xr}(也称为论域), 记P(U)为U的幂集.对于X∈ P(U), 记~XXU上的补集, 即

~X=U-X={xU|xX}.

定义1[10]S=(U, A)为一个信息系统, 其中U={x1, x2, …, xr}为一个非空有限对象集, 称为论域, A={a1, a2, …, aM}为一个非空有限属性集, 对于∀ aA, 有aUVa, 即a(x)∈ Va, xU, 其中

Va={a(x)|xU}

为属性a的值域.

对于信息系统S=(U, A), BA, 记

RB={(x, y)∈ U× U|a(x)=a(y), ∀ aB},

RB为由属性子集B诱导的不可分辨关系, RB可将U中元素分成两两不相交的等价类, 即

[x]B={yU|(x, y)∈ RB}, ∀ xU,

它们构成U的一个划分, 即

U/RB={[x]B|xU}.

对于X∈ P(U), X关于属性子集B的下近似和上近似定义如下:

RB¯(X)={xU|[x]BX}, RB¯X)={x∈ U|x]BXØ }.

1.1 广义决策多尺度信息系统

定义2[31]S=(U, C∪ {d})为一个具有多尺度决策的广义多尺度信息系统, 简称为广义决策多尺度信息系统, 其中,

(U, C)=(U, { ajk|k=1, 2, …, Ij; j=1, 2, …, M})

为一个广义多尺度信息系统, dC为具有n个尺度的决策属性, S也可表示为

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n}).

在广义决策多尺度信息系统

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

中, ajkUVjk为一个满射, Vjk为条件属性aj在第k个尺度下的值域.对于j∈ {1, 2, …, M}, 1≤ kIj-1, 存在一个满射 gjk, k+1VjkVjk+1, 使得

ajk+1= gjk, k+1􀳱 ajk,

ajk+1(x)= gjk, k+1( ajk(x)), xU,

gjk, k+1为条件属性aj的一个信息粒度变换, dtUVdt为一个满射, Vdt为决策属性d在第t个尺度下的值域.对于t∈ {1, 2, …, n-1}, 存在一个满射

hdt, t+1VdtVdt+1,

使得

dt+1= hdt, t+1􀳱dt,

dt+1(x)= hdt, t+1(dt(x)), xU,

hdt, t+1为决策属性d的一个信息粒度变换[11].

定义3[31]

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度信息系统, 若将条件属性aj(1≤ jM)限制在该属性的第ij(1≤ ijIj)尺度下, 则

K=(i1, i2, …, iM)

称为S的条件属性的一个尺度组合, 记S的条件属性尺度组合全体为K.若在此基础上将决策属性d限制在第t(1≤ tn)尺度下, 则

Q=(i1, i2, …, iM, t)

称为S的一个尺度选择.记S的尺度选择全体为Q, 则每个尺度选择

(i1, i2, …, iM, t)=Q∈ Q

形成一个单尺度决策表SQ=(U, CK∪ {dt}), 其中

CK={ a1i1, a2i2, …, amim}.

定义4 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度信息系统.对于两个尺度组合

K1=( i11, i21, …, im1)∈ K, K2=( i12, i22, …, im2)∈ K,

若对∀ j∈ {1, 2, …, M}, 都有 ij1ij2, 则称尺度组合K1K2细, 或K2K1粗, 记为K1K2.若K1K2, 且∃j∈ {1, 2, …, M}, 使得 ij1< ij2, 则称尺度组合K1严格细于K2, 或K2严格粗于K1, 记作K1K2.对于S的两个尺度选择

Q1=( i11, i21, …, im1, t1)∈ Q, Q2=( i12, i22, …, im2, t2)∈ Q,

若对∀ j∈ {1, 2, …, M}, 都有 ij1ij2, 且t2t1, 则称尺度选择Q1Q2细, 或Q2Q1粗, 记作Q1Q2; 若Q1Q2t2< t1或∃j∈ {1, 2, …, M}, 使得 ij1< ij2, 则称尺度选择Q1严格细于Q2, 或Q2严格粗于Q1, 记作Q1Q2.

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度信息系统, Q为S的尺度选择全体.对于

Q1=( i11, i21, …, im1, t1)∈ Q, Q2=( i12, i22, …, im2, t2)∈ Q,

定义

Q1Q2=( l11l12, l21l22, …, lm1lm2, t1t2),

Q1Q2=( l11l12, l21l22, …, lm1lm2, t1t2),

其中,

lj1lj2=Min{ l21, l22}, lj1lj2=Max{ l21, l22}, j{1, 2, …, M},

t1t2=Min{t1, t2}, t1t2=Max{t1, t2},

则可验证

Q1Q2Q1Q2=Q1Q1Q2=Q2.

且(Q, ≼, ∧ , ∨ )为一个有界格, 其中(1, 1, …, 1, n)为最小元, (I1, I2, …, IM, 1)为最大元.

1.2 序信息系统

定义5 称二元组(L, ⩽)为一个全序集, 其中LØ 称为标记集, ⩽为L上的二元关系, 满足

1)自反性.对于∀ xL, xx.

2)传递性.对于∀ xL, yL, zL, xy, yz蕴含xz.

3)⩽是线性序.对于∀ xL, yL, 或xy, 或yx.

定义6 对于2个全序集(L1, ⩽1)和(L2, ⩽2), 若映射

g∶ (L1, ⩽1)→ (L2, ⩽2),

对∀ lL1, sL1, 有

l1sg(l)⩽2g(s),

则称映射g为保序的.

不失一般性, 本文讨论序信息系统中的属性取值按照优先级递增排序.在信息系统S=(U, A)中, 若属性a的值域是全序集, 则称属性a为一个标准或准则.设aA为一个准则, 在a的值域Va上建立偏序关系⩾a, 对于xU, yU, ya x意为关于准则a, 对象y至少和对象x一样优, 或者说对象y支配对象x.若对于准则集BA, yB x, 意为对于∀ aB, ya x, 即对于B中的任意准则, 对象y至少和对象x一样优.

定义7[40]S=(U, A)为一个信息系统, 若S的条件属性集A={a1, a2, …, aM}中每个属性都是标准或准则, 则称S为一个序信息系统(Ordered InforMation SysteM, OIS).

在序信息系统中, 对于BA, 记

RB={(y, x)∈ U× U|a(y)⩾a(x), ∀ aB},

RBU上的优势关系.记

[x ]B={yU|a(y)⩾a(x), ∀ aB}={y∈ U|y, x)RB,

[x ]B为对象x关于属性子集B的优势类.记

U/ RB={[x ]B|xU},

U/ RB为属性子集B导出的优势类全体, 构成U上的一个覆盖.

对于X∈ P(U), BA, X关于优势关系 RB的下近似和上近似分别为[38, 39]

RB¯(X)={xU|[x ]BX}, RB¯X)={x∈ U|x ]BXØ }.

定义8[40]S=(U, A∪ {d})为一个序决策系统(Ordered Decision SysteM, ODS), 若S=(U, A)为一个序信息系统, 决策属性dA也是标准或准则, 记

Rd={(y, x)∈ U× U|d(y)⩾d(x)},

Rd为决策属性d导出的一个优势关系.记

[x ]d={yU|d(y)⩾d(x)}={y∈ U|y, x)Rd, xU,

[x ]d为在论域U上决策值至少和对象x一样优的对象的集合, 称为决策优势类.记

U/ Rd={[x ]dxU},

U/ Rd为决策优势类全体, 也构成U上的一个覆盖.称序决策系统S=(U, A∪ {d})为协调的, 若 RBRd; 否则, 称S=(U, A∪ {d})是不协调的.

1.3 证据理论

定义9[32]U为一个非空有限集合, 对于一个集合函数M∶ P(U)→ [0, 1], 若满足

M(Ø )=0, XP(U)M(X)=1,

则称M为一个Mass函数或一个基本概率指派.

对于一个集合X∈ P(U), 若M(X)> 0, 则称X为函数M的一个焦元.记

M={X∈ P(U)|M(X)> 0}

M的全体焦元构成的集合, 则称序对(M, M)为U上的一个信任结构.

任何一个信任结构可导出一对信任函数与似然函数.

定义10[32] 设(M, M)为U上的一个信任结构, 在U上定义信任函数Bel∶ P(U)→ [0, 1]和似然函数Pl∶ P(U)→ [0, 1]如下:

Bel(X)= YØYXM(Y), ∀ X∈ P(U), Pl(X)= YYXØ(Y), ∀ X∈ P(U).

可验证, 信任函数和似然函数是对偶的, 即

Bel(X)=1-Pl(~X), Pl(X)=1-Bel(~X),

其中~XXU中的补集.

粗糙集理论和D-S证据理论之间具有较强的联系, 已证实, 信息系统中每个属性子集导出的集合的下近似概率与上近似概率分别为该集合在某个信任结构下的信任度与似然度.

定理1[33]S=(U, A)为一个信息系统, 对于∀ X∈ P(U), BA, 记

BelB(X)=P RB¯(X), PlB(X)=P RB¯(X).

其中,

P(X)= XU,

|X|为X的基数, 则

Bel∶ P(U)→ [0, 1], Pl∶ P(U)→ [0, 1]

分别为U上的信任函数与似然函数, 对应的Mass函数为:

MB(X)= P(X), XU/RB0, XU/RB

2 广义决策多尺度序信息系统
2.1 基本概念

定义11 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度信息系统, 若对于

Q1=(1, 1, …, 1)∈ Q, SQ1(U, CK1{d1})

为一个序决策系统, 且对于每个条件属性aj(j∈ {1, 2, …, M})和每个尺度k∈ {1, 2, …, Ij-1}, 条件属性aj(j∈ {1, 2, …, M})的信息粒度变换 gjk, k+1(k∈ {1, 2, …, Ij-1})都是保序的, 且对于决策属性d和每个尺度t∈ {1, 2, …, n-1}, 决策属性d的信息粒度变换 hdt, t+1也都是保序的, 则称S为一个决策多尺度序信息系统.

由定义11知, 只要

SQ1=(U, CK1∪ {d1})

为序决策系统, 且条件属性的信息粒度变换和决策属性的信息粒度变换都是保序的, 则对于S的任意一个尺度选择

Q=(K, t)∈ Q, K∈ K,

对应的决策系统

SQ=(U, CK∪ {dt})

都是一个序决策系统.

定义12 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

K=(i1, i2, …, iM)∈ K,

RCK={(y, x)∈ U× U| ajij(y)⩾ ajij(x), ∀ ajijCK},

RCK是由CK导出的优势关系.记

[x ]CK={yU| ajij(y)⩾ ajij(x), ∀ ajijCK}={y∈ U|y, x)RCk, xU,

[x ]CK为对象x关于优势关系 RCK的优势类.记

U/ RCK={[x ]CK|xU},

U/ RCKU上由优势关系 RCK导出的优势类全体.

对于∀ X∈ P(U), X关于 RCK的下近似 RCK¯(X)与上近似 RCK¯(X)定义如下:

RCK¯(X)={x∈ U|[x ]CK⊆X}, RCK¯X)={x∈ U|x ]CKX≠ Ø }.

类似于文献[20], 可证明命题1成立.

命题1 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

X∈ P(U), Y∈ P(U), K∈ K, Q=(K, t)∈ Q,

则如下性质成立:

1) RCK¯(X)=~ RCK¯(~X),

RCK¯(X)=~ RCK¯(~X).

2) RCK¯(Ø )= RCK¯(Ø )=Ø ,

RCK¯(U)= RCK¯(U)=U.

3) RCK¯(XY)= RCK¯(X)∩ RCK¯(Y),

RCK¯(XY)= RCK¯(X)∪ RCK¯(Y).

4) RCK¯(XY)⊇ RCK¯(X)∪ RCK¯(Y),

RCK¯(XY)⊆ RCK¯(X)∩ RCK¯(Y).

5) RCK¯(X)⊆XRCK¯(X).

6)若XY, 则

RCK¯(X)⊆ RCK¯(Y), RCK¯(X)⊆ RCK¯(Y).

7) RCK¯(X)= RCK¯RCK¯(X),

RCK¯(X)= RCK¯RCK¯(X).

8)若K'∈ K, KK', 则

RCK'¯(X)⊆ RCK¯(X), RCK¯(X)⊆ RCK'¯(X).

9)若记

KMin=(1, 1, …, 1)∈ K, KMax=(I1, I2, …, IM)∈ K,

则对于∀ K∈ K, 有

RCKMax¯(X)⊆ RCK¯(X)⊆ RCKMin¯(X), RCKMin¯X)RCK¯X)RCKMax¯X).

定义13 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

xU, K∈ K, Q=(K, t)∈ Q,

Rdt={(y, x)∈ U× U|dt(y)⩾dt(x)},

Rdt为决策属性d在第t个尺度上导出的优势关系.记

[x ]dt={y∈ U|dt(y)⩾dt(x)}= {y∈ U|y, x)∈ Rdt,

[x ]dt为对象x关于优势关系 Rdt的优势决策类.记

U/ Rdt={[x ]dt|xU},

U/ RdtRdt导出的全体优势决策类.

xU, [x ]dt关于条件属性集CK的下近似和上近似分别为

RCK¯([x ]dt)={y∈ U|[y ]CK⊆[x ]dt}, RCK¯[x ]dt={y∈ U|y ]CK[x ]dtØ }.

决策属性dt关于 RCK的正域Po sCK(dt)和分类精度r(CK, dt)分别定义如下:

Po sCK(dt)= [x]dtU/RdtRCK¯(X), r(CK, dt)= PosCK(dt)U.

类似于文献[20], 可得命题2.

命题2 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, 对于

xU, K∈ K, K'∈ K, KK',

1) RCK¯([x ]dt)⊆[x ]dtRCK¯([x ]dt),

2) RCK¯([x ]dt)=~ RCK¯(~[x ]dt),

3) RCK'¯([x ]dt)⊆ RCK¯([x ]dt),

RCK¯([x ]dt)⊆ RCK'¯([x ]dt),

4) RCK¯([x ]dt)⊆ RCK¯([x ]dt+1),

RCK¯([x ]dt)⊆ RCK¯([x ]dt+1),

t∈ {1, 2, …, n-1},

5)Po sCK'(dt)⊆Po sCK(dt),

r(CK', dt)≤ r(CK, dt),

6)Po sCK(dt)⊆Po sCK(dt+1),

r(CK, dt)≤ r(CK, dt+1),

t∈ {1, 2, …, n-1},

7)若KMin=(1, 1, …, 1)∈ K,

KMax=(I1, I2, …, IM)∈ K,

则对于∀ K∈ K, 都有

r( CKMax, dt)≤ r(CK, dt)≤ r( CKMin, dt).

2.2 证据理论

类似于文献[44]和文献[45]可得, 广义决策多尺度序信息系统中每个尺度组合下集合的下近似集与上近似集的概率一定是某个信任结构下该集合的信任度与似然度.

定理2 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, K∈ K, 对于X∈ P(U), 记

BelCK(X)=P RCK¯(X), PlCKX)=P RCK¯X)

BelCK∶ P(U)→ [0, 1], PlCK∶ P(U)→ [0, 1]

分别为U上一对对偶的信任函数与似然函数, 对应的Mass函数为:

mCK(X)= hCK(X)U, XU/RCK0, XU/RCK

其中,

hCK(X)={xU|[x ]CK=X}, X∈ P(U).

推论1 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, 对于K1∈ K, K2∈ K, K1K2, 则对于∀ X∈ P(U), 信任函数 BelCK和似然函数 PlCK满足:

BelCK2(X)≤ BelCK1(X)≤ XUPlCK1(X)≤ PlCK2(X).

3 协调广义决策多尺度序信息系统的尺度选择

尺度选择是从多尺度信息系统中知识获取的一个关键步骤, 在广义决策多尺度序信息系统中, 寻找最优尺度选择的目的是从系统中选择一个合适的单尺度序决策系统, 用于最终的决策规则提取.

3.1 广义决策多尺度序信息系统的尺度选择

定义14 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

K1=(1, 1, …, 1)∈ K

为条件属性集C的最细尺度组合.对于t∈ {1, 2, …, n}, 若 RCK1Rdt, 则称S关于决策属性dt是协调的.若 RCK1Rdn, 即S关于最粗尺度的决策属性dn是协调的, 则称S是协调的; 否则, 称S是不协调的.

定义15 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, 对于

K=(i1, i2, …, iM)∈ K,

对应一个具有多尺度决策的单尺度信息系统

SK=(U, CK∪ {d})=(U, { a1i1a2i2…, aMiM∪ {dt|=|1, 2, …, n}).

对于t∈ {1, 2, …, n}, 若 RCKRdt, 则称SK关于决策属性dt是协调的.若 RCKRdn, 即SK关于最粗尺度对应的决策属性dn是协调的, 则称SK是协调的; 否则称SK是不协调的.

定理3 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, K∈ K, K'∈ K, 若KK', 且SK'是协调的, 则SK也是协调的.

证明 一方面, 由于SK'=(U, CK'∪ {d})是协调的, 因此 RCK'Rdn.另一方面, 由KK'可知 RCKRCK', 从而 RCKRdn, 故由定义15知,

SK=(U, CK∪ {d})

也是协调的. 证毕.

定理4 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

Q1=(K1, t1)∈ Q, Q2=(K2, t2)∈ Q, Q1Q2,

若序决策系统 SQ2是协调的, 则 SQ1也是协调的.

证明 由于 SQ2=(U, CK2∪ { dt2})是协调的, 因此 RCK2Rdt2, 又由于Q1Q2, 即K1K2, 且t2t1, 从而 RCK1RCK2, 且 Rdt2Rdt1, 于是 RCK1Rdt1, 即 SQ1是协调的. 证毕.

定义16 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统, 对于

Q=(K, t)∈ Q,

若满足

1)SQ是协调的, 即 RCKRdt;

2)对任意满足QQ'Q'=(K', t')∈ Q, SQ'是不协调的, 即 RCK'Rdt'.

则称Q=(K, t)为S的一个最优尺度选择, 并称

SQ=(U, CK∪ {dt})

S的一个最优协调序决策系统.

由定义16可见, 一个协调广义决策多尺度序信息系统S=(U, C∪ {d})的一个最优尺度选择

Q=(K, t)∈ Q

是Q中使SQ是协调的最粗的尺度选择, 因此, 寻求协调广义决策多尺度序信息系统的一个最优尺度选择问题可转化为求以下最优解问题:

Max j=1mij-t, s.t. RCKRdtK=(i1, i2, , iM), 1≤ ijIj, 1≤ t≤ n.

满足上述最优解问题的一个尺度选择Q就是S的一个最优尺度选择.

定义17 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统, K1=(1, 1, …, 1)∈ K, Q=(K, t)∈ Q,

1)若对于∀ xU, 有 RCK¯([x ]dt)= RCK1¯([x ]dt), 则称SQ关于S是下近似协调的; 若SQ关于S是下近似协调的, 且对于任意满足QQ'Q'=(K', t')∈ Q, ∃yU, 使得 RCK'¯([y ]dt')≠ RCK1¯([y ]dt), 即SQ'关于S不是下近似协调的, 则称Q=(K, t)是S的一个下近似最优尺度选择.

2)若对于∀ xU, 都有 RCK¯([x ]dt)= RCK1¯([x ]dt), 则称SQ关于S是上近似协调的; 若SQ关于S是上近似协调的, 且对于任意满足QQ'Q'=(K', t')∈ Q, ∃yU, 使得 RCK'¯([y ]dt')≠ RCK1¯([y ]dt), 即SQ'关于S不是上近似协调的, 则称Q=(K, t)是S的一个上近似最优尺度选择.

定义18 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

K1=(1, 1, …, 1)∈ K, Q=(K, t)∈ Q,

1)若对于∀ xU, 都有

Be lCK([x ]dt)= BelCK1([x ]dt),

则称SQ关于S是信任协调的; 若SQ关于S是信任协调的, 且对于任意满足QQ'

Q'=(K', t')∈ Q,

yU, 使得Be lCK'([y ]dt')≠ BelCK1([y ]dt),

SQ'关于S不是信任协调的, 则称Q=(K, t)是S的一个信任最优尺度选择.

2)若对于∀ xU, 都有P lCK([x ]dt)=P lCK1([x ]dt),

则称SQ关于S是似然协调的; 若SQ关于S是似然协调的, 且对于任意满足QQ'Q'=(K', t')∈ Q,

yU, 使得

P lCK'([y ]dt')≠ P lCK1([y ]dt),

SQ'关于S不是似然协调的, 则称Q=(K, t)是S的一个似然最优尺度选择.

定理5 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

Q=(K, t)∈ Q,

1)SQ关于S是下近似协调的当且仅当SQ关于S是信任协调的.

2)QS的下近似最优尺度选择当且仅当QS的信任最优尺度选择.

3)SQ关于S是上近似协调的当且仅当SQ关于S是似然协调的.

4)QS的上近似最优尺度选择当且仅当QS的似然最优尺度选择.

证明 先证1).充分性.设SQ关于S是下近似协调, 则对∀ xU, 有

RCK¯([x ]dt)= RCK1¯([x ]dt),

从而

P RCK¯([x ]dt)=P RCK1¯([x ]dt),

Be lCK([x ]dt)=Be lCK1([x ]dt),

因此, SQ关于S是信任协调的.

必要性.若SQ关于S是信任协调的, 则对∀ xU,

BelCK([x ]dt)=Be lCK1([x ]dt),

|RCK¯([x]dt)|U= |RCK1¯([x]dt)|U.

又由于

RCK¯([x ]dt)⊆ RCK1¯([x ]dt),

于是可得

RCK¯([x ]dt)= RCK1¯([x ]dt),

因此, SQ关于S是下近似协调的.

再证2).由结论1)即得.

再证3)充分性.设SQ关于S是上近似协调的, 则对于∀ xU, 有

RCK¯([x ]dt)= RCK1¯([x ]dt),

从而

P RCK¯([x ]dt)=P RCK1¯([x ]dt),

P lCK([x ]dt)=P lCK1([x ]dt),

因此, SQ关于S是似然协调的.

必要性.若SQ关于S是似然协调的, 则对于∀ xU, 有P lCK([x ]dt)=P lCK1([x ]dt), 即 |RCK¯([x]dt)|U= |RCK1¯([x]dt)|U,

又由于 RCK¯([x ]dt)⊆ RCK1¯([x ]dt), 于是可得 RCK¯([x ]dt)= RCK1¯([x ]dt), 因此, SQ关于S是上近似协调的.

最后证明4).由结论3)即得. 证毕.

定理6 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

Q=(K, t)∈ Q,

SQ是协调的当且仅当SQ关于S是信任协调的.

证明 充分性.设SQ是协调的, 则∀ xU, 有

[x ]CK⊆[x ]dt.

由命题1知,

RCK¯([x ]dt)⊆[x ]dt

成立, 对于∀ y∈ [x ]dt, 由[x ]dt的定义可知, 有

[y ]dt⊆[x ]dt.

由于SQ关于S是协调的, 即[y ]CK⊆[y ]dt, 从而[y ]CK⊆[x ]dt, 即yRCK¯([x ]dt), 故有

[x ]dtRCK¯([x ]dt),

这样就证明

RCK¯([x ]dt)=[x ]dt.

又由于K1=(1, 1, …, 1)是最细的尺度组合, 因此

[x ]CK1⊆[x ]CK,

从而

[x ]CK1⊆[x ]dt,

即序决策系统 S(K1, t)也是协调的, 从而也有

RCK1¯([x ]dt)=[x ]dt

成立, 于是

RCK¯([x ]dt)= RCK1¯([x ]dt),

再由定理5知

Be lCK([x ]dt)=Be lCK1([x ]dt),

SQ关于S是信任协调的.

必要性.设SQ是关于S信任协调的, 由定理5知, 对于∀ xU, 有

RCK¯([x ]dt)= RCK1¯([x ]dt).

反证, 假如SQ是不协调的, 即 RCKRdt, 则∃y∈ U, 使得[y ]CK⊈[y ]dt.因为S是协调的, 因此, [y ]CK1⊆[y ]dt, 从而由下近似定义知y∈ RCK1¯([y ]dt), 于是由条件得y∈ RCK¯([y ]dt), 即[y ]CK⊆[y ]dt, 矛盾.因此, SQ是协调的. 证毕.

定义19 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

K1=(1, 1, …, 1)∈ K,

对于t∈ {1, 2, …, n}, S的信任和Mt与似然和Nt分别定义为

Mt= DU/RdtBelCK1(D), Nt= DU/RdtPlCK1D).

其中,

U/ Rdt={[x ]dt|x∈ U}

为决策属性d在第t个尺度下决策优势类全体.

定理7 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统,

Q=(K, t)∈ Q,

1)SQ是协调的当且仅当

DU/RdtBe lCK(D)=Mt;

2)Q=(K, t)∈ Q为S的最优尺度选择当且仅当

DU/RdtBe lCK(D)=Mt,

且对任意满足QQ'

Q'=(K', t)∈ Q,

DU/RdtBe lCK'(D)< Mt.

证明 由定理6和推论1即证明1).由结论1)即证明2). 证毕.

定理8 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统, Q=(K, t)∈ Q,

1)SQ是似然协调的当且仅当 DU/RdtPlCK(D)=Nt;

2)Q=(K, t)∈ Q是S的似然最优尺度选择当且仅当 DU/RdtPlCK(D)=Nt, 且对任意满足QQ'Q'=(K', t)∈ Q, 有 DU/RdtPlCK'(D)> Nt.

证明 类似于定理7的证明. 证毕.

由上述结论可见, 保持序决策系统是协调的最粗尺度选择(即最优尺度选择)与下近似最优尺度选择和信任最优尺度选择都是等价的, 而上近似最优尺度选择与似然最优尺度选择也是等价的.因此, 定义16~定义18给出的5种类型的最优尺度选择概念实际上只有2种不同的类型.

3.2 示例

例1 表1为一个广义决策多尺度序信息系统

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n}),

其中,

U={x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12}, C={a1, a2}.

条件属性a1a2都有3个尺度, 决策属性d有2个尺度.条件属性a1a2和决策属性

d={dt|t=1, 2}

的信息粒度变换分别如下.对于xU:

1) gj1, 2Va1jVa2j, gj1, 2aj1x))= B, aj1(x){9, 10}C, aj1(x){7, 8}D, aj1(x){5, 6}E, aj1(x){3, 4}j=1, 2;

2) gj2, 3Va2jVa3j, gj2, 3( aj2(x))= N, aj2(x){B, C}M, aj2(x){D}K, aj2(x){E}j=1, 2;

3)h1, 2Vd1Vd2, h1, 2(d1(x))= B, d1(x){9, 10}C, d1(x){7, 8}D, d1(x){5, 6}E, d1(x){3, 4}

其中, 数值型值域 Va1jVd1按自然顺序排序, 条件属性值域 Va2j, Va3j和决策属性值域 Vd2上的全序关系分别为

B> C> D> E, N> M> K.

表1 一个广义决策多尺度序信息系统 Table 1 A generalized decision Multi-scale ordered inforMation systeM

图1为S的全体尺度选择的格结构.

图1 尺度选择的格结构Fig.1 Lattice structure of scale selections

1)判断S是否是协调的; 2)确定S的最优尺度选择; 3)确定S的上近似最优尺度选择、下近似最优尺度选择、信任最优尺度选择和似然协调最优尺度选择.

解:1)对于K1=(1, 1), 即 CK1={ a11, a21}, 经计算可得

[x1 ]CK1={x1, x12},

[x2 ]CK1{x1, x2, x12},

[x3= ]CK1x1, x2, x3, x7, x12},

[x4={ ]CK11, x4, x7, x8, x11},

[x5={x ]CK1, x7, x8, x12},

[x6={x1 ]CK1x5, x6, x7, x8, x9, x12}=[x9,

[x7 ]CK1={x7},

[x8 ]CK1{x7, x8, x12},

[x10= ]CK1x1, x5, x6, x7, x8, x9, x10, x12},

[x11={ ]CK11, x4, x5, x6, x7, x8, x9, x11, x12},

[x12={x ]CK12},

U/ RCK1={{x1, x12}, {x1, x2, x12}, {x1, x2, x3, x7, x12},

{x1, x4, x7, x8, x11}, {x5, x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x12}, {x7}, {x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x10, x12},

{x1, x4, x5, x6, x7, x8, x9, x11, x12}, {x12}}.

对于d1, 有

[x1 ]d1={x1, x7, x8, x12}=[x8 ]d1,

[x2 ]d1{x1, x2, x4, x5, x7, x8, x12}=[x4 ]d1[x5 ]d1,

[x3 ]d1={x1, x2, x3, x4, x5, x6, x7, x8, x9, x12}=[x6 ]d1=[x9 ]d1,

[X7 ]d1={x7, x12}=[x12 ]d1

[x10 ]d1={x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12}=U=[x11 ]d1,

U/ Rd1={{x1, x7, x8, x12}, {x1, x2, x4, x5, x7, x8, x12}, U, {x7, x12}, {x1, x2, x3, x4, x5, x6, x7, x8, x9, x12}}.

对于d2, 有

[x1 ]d2={x1, x2, x4, x5, x7, x8, x12}=[x2 ]d2= [x4 ]d2[x5 ]d2[x8 ]d2,

[x3 ]d2={x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12}=

U=[x6 ]d2=[x9 ]d2=[x10 ]d2=[x11 ]d2,

[x7 ]d2={x7, x12}=[x12 ]d2,

U/ Rd2={{x1, x2, x4, x5, x7, x8, x12}, {x7, x12}, U}.

易见U/ RCK1U/ Rd2, 因此S是协调的.

2)设K2=(1, 2), 即 CK2={ a11, a22}, 经计算有

U/ RCK2={{x1, x12}, {x1, x2, x12}, {x1, x2, x3, x7, x12},

{x1, x2, x4, x7, x8, x12}, {x1, x5, x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x12}, {x7},

{x1, x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x10, x12},

{x1, x2, x4, x5, x6, x7, x8, x9, x11, x12}},

因此

U/ RCK2U/ Rd1, U/ RCK2U/ Rd2.

K3=(2, 1), 即 CK3={ a12, a21}, 经计算有

U/ RCK3={{x1, x12}, {x1, x2, x12},

{x1, x2, x3, x4, x7, x8, x12}, {x1, x4, x7, x8, x12},

{x5, x7, x8, x12}, {x1, x5, x6, x7, x8, x9, x12},

{x7}, {x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x10, x12},

{x1, x4, x5, x6, x7, x8, x9, x11, x12}, {x12}},

因此

U/ RCK3U/ Rd2, U/ RCK3U/ Rd1.

K4=(2, 2), 即 CK4={ a12, a22}, 经计算有

U/ RCK4={{x1, x12}, {x1, x2, x12},

{x1, x2, x3, x4, x7, x8, x12},

{x1, x2, x4, x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x12}, {x7},

{x1, x7, x8, x12},

{x1, x5, x6, x7, x8, x9, x10, x12},

{x1, x2, x4, x5, x6, x7, x8, x9, x11, x12}},

因此

U/ RCK4⊈U/ Rd1, U/ RCK4⊈U/ Rd2,

所以S有唯一的最优尺度选择(2, 1, 1).

3)求S的下近似最优尺度选择.只需验证当t=1时的情况即可, 对于K1=(1, 1), 即 CK1={ a11, a21}, 经计算有

RCK1¯x1d1=x1, x7, x8, x12=RCK1¯x8d1,

RCK1¯x2d1=x1, x2, x4, x5, x7, x8, x12=RCK1¯x4d1=RCK1¯x5d1,

RCK1¯x3d1=x1, x2, x3, x4, x5, x6, x7, x8, x9, x12=RCK1¯x6d1=RCK1¯x9d1,

RCK1¯x7d1=x7, x12=RCK1¯x12d1,

RCK1¯x10d1=x1, x2, x3, x4, x5, x6, x7, x8, x9, x10, x11, x12=U=RCK1¯x11d1,

对于K2=(1, 2), 即 CK2={ a11, a22}, 经计算对于x7, 有

RCK2¯([x7 ]d1)≠ RCK1¯([x7 ]d1),

且对于x12, 有

RCK2¯([x12 ]d2)≠ RCK1¯([x12 ]d2).

对于K3=(2, 1), 即 CK3={ a12, a21}, 经计算对∀ xU, 有

RCK3¯([x ]d1)= RCK1¯([x ]d1)

成立.

对于K4=(2, 2), 即 CK4={ a12, a22}, 经计算对x7, 有

RCK4¯([x7 ]d1)≠ RCK1¯([x7 ]d1),

且对于x12, 有

RCK4¯([x12 ]d2)≠ RCK1¯([x12 ]d2).

所以S有唯一的下近似最优尺度选择(2, 1, 1).

S的上近似最优尺度选择.当t=1时, 对于K1=(1, 1), 即 CK1={ a11, a21}, 经计算有

RCK1¯x1d1=U=RCK1¯x8d1,

RCK1¯x2d1=U=RCK1¯x4d1=RCK1¯x5d1,

RCK1¯x3d1=U=RCK1¯x6d1=RCK1¯x9d1,

RCK1¯x7d1=U=RCK1¯x12d1,

RCK1¯x10d1=U=RCK1¯x11d1,

对于K2=(1, 2), 则 CK2={ a11, a22}, 经计算对于∀ xU, 有

RCK2¯([x ]d1)= RCK1¯([x ]d1).

同理, 对于K9=(3, 3), 即 CK9={ a13, a23}, 经计算对于∀ xU, 有

RCK9¯([x ]d1)= RCK1¯([x ]d1),

所以(3, 3, 1)是S的上近似最优尺度选择.

S的信任最优尺度选择.当t=1时,

DURd1BelCK1D=4+2+7+10+1212=3512

DURd1BelCK2D=4+1+7+10+1212=3412< 3512

DURd1BelCK3D=4+2+7+10+1212=3512

DURd1BelCK4D=4+1+6+10+1212=3312< 3512

t=2时,

DURd2BelCK1D=2+7+1212=2112

DURd2BelCK2D=1+7+1212=2012< 2112

DURd2BelCK3D=2+7+1212=2112

DURd2BelCK4D=1+6+1212=1912< 2112

因此, (2, 1, 1)为S的信任最优尺度选择.

S的似然最优尺度选择.由于(3, 3, 1)是S的上近似最优尺度选择, 只需验证K9=(3, 3)和t=1时即可.

DU/Rd1PlCK1(D)=1+1+1+1+1=5,

DU/Rd1PlCK9(D)=1+1+1+1+1=5,

DU/Rd1PlCK1(D)= DU/Rd2PlCK9(D),

(3, 3, 1)为S的似然最优尺度选择.

对于S, (2, 1, 1)为最优尺度选择、下近似最优尺度选择和信任最优尺度选择, (3, 3, 1)为上近似最优尺度选择和似然最优尺度选择.

4 协调广义决策多尺度序信息系统的约简与规则提取
4.1 广义决策多尺度序信息系统的约简

定义20 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

K∈ K, Q=(K, t)∈ Q, RCKRdt,

若对于BC, 有 RBKRdt, 则称BSQ-尺度协调集.若BSQ-尺度协调集, 且对于∀ AB, 都有 RAKRdt, 则称BS的一个Q-尺度约简.

定理9 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

K1∈ K, K2∈ K, K1≺K2, Q1=(K1, t)∈ Q, Q2=(K2, t)∈ Q.

BSQ2-尺度协调集, 则BS的一个Q1-尺度协调集.

证明 由定义20与定理3可证. 证毕.

定义21 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

K=(i1, i2, …, iM)∈ K, Q=(K, t)∈ Q,

定义

Dt={(x, y)∈ U× U|dt(x)< dt(y)},

DdtK(x, y)= {ajijCK|(x, y)R{ajij}}, (x, y)DtØ, (x, y)Dt

DdtK=( DdtK(x, y)|x, yU),

其中

R{ajij}={(x, y)∈ U× U| ajij(x)⩾ ajij(y)} ,

DdtK(x, y)是对象x, y在尺度组合K下关于决策属性dt的可辨识属性集, DdtK为协调广义决策多尺度序信息系统S在尺度选择Q下的可辨识矩阵.

定义22 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个协调广义决策多尺度序信息系统,

BC, K∈ K, Q=(K, t)∈ Q,

定义

ΔdtK= (x, y)U×U(∨ DdtK(x, y))

S在尺度选择Q上的可辨识函数, 其中, ∧ 为合取, ∨ 为析取.

类似于文献[37]~文献[39], 将上式给出的合取式转化为极小析取范式, 则该极小析取范式中每个合取式中的属性集合就是系统的一个Q-尺度约简.

4.2 广义决策多尺度序信息系统的序决策规则

获取

本节在最优尺度选择约简的基础上给出蕴含在广义决策多尺度序信息系统中的序决策规则.

定义23 设

S=(U, C∪ {d})=(U, { ajk|=|1, 2, …, Ij; j=1, 2, …, M}∪ {dtt|1, 2, …, n})

为一个广义决策多尺度序信息系统, 对于BC,

K=(i1, i2, …, iM)∈ K, ajijBK,

Vjij为属性aj在第ij尺度下的值域, vajijVjij, 称( ajij, ⩾, vajij)为S在第ij尺度下的一个B-原子性质或B-原子公式.任何一个B-原子性质或几个B-原子性质的合取称为在尺度组合K下的一个B-描述子.原子公式( ajij, ⩾, vajij)的支持对象表示如下:

(ajij, , vajij)={x∈ U| ajij(x)⩾ vajij}.

蕴含在决策信息系统中的命题知识可使用决策规则的形式表示: ts, 其中, t为规则的前件, s为规则的后件, 表示由t可得出s.对同时满足规则的前件和后件的对象, 称为支持这条规则.

对于协调广义决策多尺度序信息系统, 结合原子公式的概念, 类似于Greco等[37, 38, 39]提出序决策规则, 可得蕴含在系统中基于优势关系的确定性序决策规则如下:

( a1i1, ⩾, va1i1)∧ ( a2i2, ⩾, va2i2)∧ …∧ ( amim, vamim(dt, , vdt).

例2 (接例1) 由于S的最优尺度选择为Q=(2, 1, 1), 则可得到在尺度选择QS的可辨识矩阵如表2所示.

由于

ΔK3d1= (x, y)U×U(∨ DK3d1(x, y))= a12a21,

于是, S在尺度选择Q=(2, 1, 1)下唯一的属性约简为{ a12, a21}.因此可得到SQ=(2, 1, 1)下确定性

序决策规则如下:

r1K3:( a12, ⩾, C)∧ ( a21, ⩾, 7)→ (d1, ⩾, 8),

该规则支持的对象为x1, x7, x8, x12.

r2K3:( a12, ⩾, C)∧ ( a21, ⩾, 5)→ (d1, ⩾, 7),

该规则支持的对象为x1, x2, x4, x5, x7, x8, x12.

r3K3:( a12, ⩾, D)∧ ( a21, ⩾, 4)→ (d1, ⩾, 6),

该规则支持的对象为x1, x2, x3, x4, x5, x6, x7, x8, x9, x12.

r4K3:( a12, ⩾, E)∧ ( a21, ⩾, 4)→ (d1, ⩾, 5),

该规则支持的对象为U.

表2 尺度选择QS的可辨识矩阵 Table 2 Discernibility Matrix of S under scale selection Q
5 结束语

最优尺度选择是多尺度信息系统知识获取的一个关键步骤, 最优尺度选择的作用是从多尺度信息系统中找到一个符合目标条件的最优子表用于最终的决策(如聚类、分类或排序).本文针对协调广义决策多尺度序信息系统中的知识获取问题, 分别使用粗糙集理论和证据理论定义下近似最优尺度选择与上近似最优尺度选择、信任最优尺度选择与似然最优尺度选择的概念, 证明保持序决策系统是协调的最粗尺度选择(即最优尺度选择)与下近似最优尺度选择和信任最优尺度选择都是等价的, 而上近似最优尺度选择与似然最优尺度选择也是等价的.并在最优尺度选择基础上, 进一步使用粗糙集辨识矩阵方法给出属性约简, 最终获得蕴含在协调广义决策多尺度序信息系统中的序决策规则集.在后续研究中:一方面, 可进一步研究在协调和不协调广义决策多尺度序信息系统中局部最优尺度选择及规则提取问题; 另一方面, 其它更复杂数据类型(如不完备广义决策多尺度序信息系统等)的最优尺度选择及序决策规则提取也是值得研究的问题.

参考文献
[1] BARGIELA A, PEDRYCZ W. Granular CoMPuting: An Introduction. Berlin, GerMany: SPringer, 2002. [本文引用:1]
[2] LIN T Y. Granular CoMPuting: Structures, RePresentations, and APPlications // Proc of the 9th International Conference on Rough Sets, Fuzzy Sets, Data Mining, and Granular CoMPuting. Berlin, GerMany: SPringer, 2003: 16-24. [本文引用:1]
[3] YAO Y Y. Granular CoMPuting: Basic Issues and Possible Solutions // Proc of the 5th Joint Conference on CoMPuting and InforMation[C/OL]. [2022-06-12]. httP: //www2. cs. uregina. ca/~yyao/PAPERS/basic. Pdf. [本文引用:1]
[4] 陈德刚, 徐伟华, 李金海, . 粒计算基础教程. 北京: 科学出版社, 2020.
(CHEN D G, XU W H, LI J H, et al. Basic Course of Granular CoMPuting. Beijing, China: Science Press, 2020. ) [本文引用:1]
[5] 梁吉业, 钱宇华, 李德玉, . 大数据挖掘的粒计算理论与方法. 中国科学(信息科学), 2015, 45(11): 1355-1369.
(LIANG J Y, QIAN Y H, LI D Y, et al. Theory and Method of Granular CoMPuting for Big Data Mining. Scientia Sinica(InforMationis), 2015, 45(11): 1355-1369. ) [本文引用:1]
[6] CHEN C L P, ZHANG C Y. Data-Intensive APPlications, Challenges, Techniques and Technologies: A Survey on Big Data. InforMation Sciences, 2014, 275: 314-347. [本文引用:1]
[7] 苗夺谦, 张清华, 钱宇华, . 从人类智能到机器实现模型——粒计算理论与方法. 智能系统学报, 2016, 11(6): 743-757.
(MIAO D Q, ZHANG Q H, QIAN Y H, et al. FroM HuMan Inte-lligence to Machine IMPleMentation Model: Theories and APPlications Based on Granular CoMPuting. CAAI Transactions on Intelligent SysteMs, 2016, 11(6): 743-757. ) [本文引用:1]
[8] 徐计, 王国胤, 于洪. 基于粒计算的大数据处理. 计算机学报, 2015, 38(8): 1497-1517.
(XU J, WANG G Y, YU H. Review of Big Data Processing Based on Granular CoMPuting. Chinese Journal of CoMPuters, 2015, 38(8): 1497-1517. ) [本文引用:1]
[9] 庞继芳, 宋鹏, 梁吉业. 面向决策分析的多粒度计算模型与方法综述. 模式识别与人工智能, 2021, 34(12): 1120-1130.
(PENG J F, SONG P, LIANG J Y. Review on Multi-granulation CoMPuting Models and Methods for Decision Analysis. Pattern Re-cognition and Artificial Intelligence, 2021, 34(12): 1120-1130. ) [本文引用:1]
[10] PAWLAK Z. Rough Sets: Theoretical AsPects of Reasoning about Data. Boston, USA: Kluwer AcadeMic Publishers, 1991. [本文引用:2]
[11] WU W Z, LEUNG Y. Theory and APPlications of Granular Labelled Partitions in Multi-scale Decision Tables. InforMation Sciences, 2011, 181(18): 3878-3897. [本文引用:2]
[12] LI F, HU B Q. A New APProach of OPtiMal Scale Selection to Multi-scale Decision Tables. InforMation Sciences, 2017, 381: 193-208. [本文引用:3]
[13] WU W Z, LEUNG Y. OPtiMal Scale Selection for Multi-scale Decision Tables. International Journal of APProxiMate Reasoning, 2013, 54(8): 1107-1129. [本文引用:1]
[14] 吴伟志, 陈超君, 李同军, . 不协调多粒度标记决策系统最优粒度的对比. 模式识别与人工智能, 2016, 29(12): 1095-1103.
(WU W Z, CHEN C J, LI T J, et al. CoMParative Study on OPtiMal Granularities in Inconsistent Multi-granular Labeled Decision SysteMs. Pattern Recognition and Artificial Intelligence, 2016, 29(12): 1095-1103. ) [本文引用:1]
[15] HAO C, LI J H, FAN M, et al. OPtiMal Scale Selection in DynaMic Multi-scale Decision Tables Based on Sequential Three-Way Decisions. InforMation Sciences OPtiMal Scale Selection in DynaMic Multi-scale Decision Tables Based on Sequential Three-Way Decisions. InforMation Sciences, 2017, 415/416: 213-232. [本文引用:1]
[16] XIE J P, YANG M H, LI J H, et al. Rule Acquisition and OPtiMal Scale Selection in Multi-scale ForMal Decision Contexts and Their APPlications to SMart City. Future Generation CoMPuter SysteMs, 2018, 83: 564-581. [本文引用:1]
[17] CHENG Y L, ZHANG Q H, WANG G Y, et al. OPtiMal Scale Selection and Attribute Reduction in Multi-scale Decision Tables Based on Three-Way Decision. InforMation Sciences, 2020, 541: 36-59. [本文引用:1]
[18] ZHANG X Q, ZHANG Q H, CHENG Y L, et al. OPtiMal Scale Selection by Integrating Uncertainty and Cost-Sensitive Learning in Multi-scale Decision Tables. International Journal of Machine Learning and Cybernetics, 2020, 11(5): 1095-1114. [本文引用:1]
[19] 陈应生, 李进金, 林荣德, . 多尺度覆盖决策信息系统的布尔矩阵方法. 模式识别与人工智能, 2020, 33(9): 776-785.
(CHEN Y S, LI J J, LIN R D, et al. Boolean Matrix APProach for Multi-scale Covering Decision InforMation SysteM. Pattern Recognition and Artificial Intelligence, 2020, 33(9): 776-785. ) [本文引用:1]
[20] ZHENG J W, WU W Z, BAO H, et al. Evidence Theory Based OPtiMal Scale Selection for Multi-scale Ordered Decision SysteMs. International Journal of Machine Learning and Cybernetics, 2022, 13(4): 1115-1129. [本文引用:5]
[21] HUANG B, LI H X, FENG G F, et al. Double-Quantitative Rough Sets, OPtiMal Scale Selection and Reduction in Multi-scale DoMinance IF Decision Tables. International Journal of APProxiMate Reasoning, 2021, 130: 170-191. [本文引用:1]
[22] LI F, HU B Q, WANG J. StePwise OPtiMal Scale Selection for Multi-scale Decision Tables via Attribute Significance. Knowledge-Based SysteMs, 2017, 129: 4-16. [本文引用:1]
[23] 吴伟志, 庄宇斌, 谭安辉, . 不协调广义多尺度决策系统的尺度组合. 模式识别与人工智能, 2018, 31(6): 485-494.
(WU W Z, ZHUANG Y B, TAN A H, et al. Scale CoMbinations in Inconsistent Generalized Multi-scale Decision SysteMs. Pattern Recognition and Artificial Intelligence, 2018, 31(6): 485-494. ) [本文引用:1]
[24] WU W Z, LEUNG Y. A CoMParison Study of OPtiMal Scale CoMbination Selection in Generalized Multi-scale Decision Tables. In-ternational Journal of Machine Learning and Cybernetics, 2020, 11(5): 961-972. [本文引用:1]
[25] BAO H, WU W Z, ZHENG J W, et al. EntroPy Based OPtiMal Scale CoMbination Selection for Generalized Multi-scale InforMation Tables. International Journal of Machine Learning and Cyberne-tics, 2021, 12: 1427-1437. [本文引用:1]
[26] SHE Y H, ZHAO Z J, HU M T, et al. On Selection of OPtiMal Cuts in CoMPlete Multi-scale Decision Tables. Artificial Intelligence Review, 2021, 54: 6125-6148. [本文引用:1]
[27] 吴伟志, 孙钰, 王霞, . 不协调广义多尺度决策系统的局部最优尺度组合选择. 模式识别与人工智能, 2021, 34(8): 689-700.
(WU W Z, SUN Y, WANG X, et al. Local OPtiMal Scale CoMbination Selections in Inconsistent Generalized Multi-scale Decision SysteMs. Pattern Recognition and Artificial Intelligence, 2021, 34(8): 689-700. ) [本文引用:1]
[28] 张清华, 张雪秋, 庞国弘. 多尺度决策系统中代价敏感的最优尺度组合. 控制与决策, 2021, 36(10): 2369-2378.
(ZHANG Q H, ZHANG X Q, PANG G H. Cost-Sensitive OPtiMal Scale CoMbination in Multi-scale Decision SysteMs. Control and Decision, 2021, 36(10): 2369-2378. ) [本文引用:1]
[29] ZHU Y J, YANG B. OPtiMal Scale CoMbination Selection for In-consistent Multi-scale Decision Tables. Soft CoMPuting, 2022, 26(13): 6119-6129. [本文引用:1]
[30] ZHANG Q H, CHENG Y L, ZHAO F, et al. OPtiMal Scale CoMbination Selection Integrating Three-Way Decision with Hasse DiagraM. IEEE Transactions on Neural Networks and Learning SysteMs, 2022, 33(8): 3675-3689. [本文引用:1]
[31] HUANG Z H, LI J J, DAI W Z, et al. Generalized Multi-scale Decision Tables with Multi-scale Decision Attributes. International Journal of APProxiMate Reasoning, 2019, 115: 194-208. [本文引用:4]
[32] SHAFER G. A MatheMatical Theory of Evidence. Princeton, USA: Princeton University Press, 1976. [本文引用:3]
[33] YAO Y Y, LINGRAS P J. InterPretations of Belief Functions in the Theory of Rough Sets. InforMation Sciences, 1998, 104(1/2): 81-106. [本文引用:2]
[34] WU W Z, LEUNG Y, ZHANG W X. Connections between Rough Set Theory and DeMPster-Shafer Theory of Evidence. International Journal of General SysteMs. 2002, 31(4): 405-430. [本文引用:1]
[35] WU W Z, LEUNG Y, MI J S. On Generalized Fuzzy Belief Functions in Infinite SPaces. IEEE Transactions on Fuzzy SysteMs, 2009, 17(2): 385-397. [本文引用:1]
[36] CAMPAGNER A, CIUCCI D, DENCEUX T. Belief Functions and Rough Sets: Survey and New Insights. International Journal of APProxiMate Reasoning, 2022, 143: 192-215. [本文引用:1]
[37] GRECO S, MATARAZZO B, SLOWINSKI R. Rough APProxiMation of a Preference Relation by DoMinance Relations. EuroPean Journal of OPerational Research, 1999, 117(1): 63-83. [本文引用:3]
[38] GRECO S, MATARAZZO B, SLOWINSKI R. Rough Sets Theory for Multicriteria Decision Analysis. EuroPean Journal of OPeratio-nal Research, 2001, 129(1): 1-47. [本文引用:3]
[39] GRECO S, MATARAZZO B, SLOWINSKI R. Rough APProxiMation by DoMinance Relations. International Journal of Intelligent SysteMs, 2002, 17(2): 153-171. [本文引用:4]
[40] SHAO M W, ZHANG W X. DoMinance Relation and Rules in an IncoMPlete Ordered InforMation SysteM. InforMational Journal of Intelligent SysteMs, 2005, 20(1): 13-27. [本文引用:3]
[41] ZHANG X X, CHEN D G, TSANG E C C. Generalized DoMinance Rough Set Models for the DoMinance Intuitionistic Fuzzy InforMation SysteMs. InforMation Sciences, 2017, 378: 1-25. [本文引用:1]
[42] HUANG B, LI H X, FENG G F, et al. DoMinance-Based Rough Sets in Multi-scale Intuitionistic Fuzzy Decision Tables. APPlied MatheMatics and CoMPutation, 2019, 348: 487-512. [本文引用:1]
[43] 徐伟华. 序信息系统与粗糙集. 北京: 科学出版社, 2013.
(XU W H. Ordered InforMation SysteMs and Rough Sets. Beijing, China: Science Press, 2013. ) [本文引用:1]
[44] XU W H, ZHANG X Y, ZHONG J M, et al. Attribute Reduction in Ordered InforMation SysteMs Based on Evidence Theory. Know-ledge and InforMation SysteMs, 2010, 25(1): 169-184. [本文引用:2]
[45] DU W S, HU B Q. Attribute Reduction in Ordered Decision Tables via Evidence Theory. InforMation Sciences, 2016, 364/365: 91-110. [本文引用:2]
[46] ZHAN J M, ZHANG K, WU W Z. An Investigation on Wu-Leung Multi-scale InforMation SysteMs and Multi-exPert GrouP Decision-Making. ExPert SysteMs with APPlications, 2021, 170. DOI: DOI:10.1016/j.eswa.2020.114542. [本文引用:1]
[47] HUANG X F, ZHAN J M. TWD-R: A Three-Way Decision APProach Based on Regret Theory in Multi-scale Decision InforMation SysteMs. InforMation Sciences, 2021, 581: 711-739. [本文引用:1]
[48] DENG J, ZHAN J M, WU W Z. A Ranking Method with a Prefe-rence Relation Based on the PTOMETHEE Method in IncoMPlete Multi-scale InforMation SysteMs. InforMation Sciences, 2022, 608: 1261-1282. [本文引用:1]