基于属性直观图的属性约简动态更新

引用本文

白璞, 万青, 马盈仓, 魏玲. 基于属性直观图的属性约简动态更新. 模式识别与人工智能, 2025,38(7): 627-640
BAI Pu, WAN Qing, MA Yingcang, WEI Ling. Dynamic Update of Attribute Reduction Based on Property Pictorial Diagrams. PATTERN RECOGNITION AND ARTIFICIAL INTELLIGENCE, 2025,38(7): 627-640. 复制到剪切板

Doi: 10.16451/j.cnki.issn1003-6059.202507004
Permissions

《模式识别与人工智能》编辑部

基于属性直观图的属性约简动态更新

白璞¹, 万青^1,², 马盈仓¹, 魏玲^2,³

1.西安工程大学理学院西安 710048

2.西北大学概念、认知与智能研究中心西安 710127

3.西北大学数学学院西安 710127

通讯作者:

万青,博士,副教授,主要研究方向为形式概念分析、粗糙集理论、粒计算.E-mail:wqysbe@163.com.

作者简介：

白璞,硕士研究生,主要研究方向为形式概念分析、粒计算.E-mail:baipu990622@163.com.

马盈仓,博士,教授,主要研究方向为粗糙集理论、机器学习、智能计算.E-mail:mayingcang@xpu.edu.cn.

魏玲,博士,教授,主要研究方向为形式概念分析、粗糙集理论、概率论.E-mail:wl@nwu.edu.cn.

收稿日期: 2025-05-23 接受日期: 2025-07-31

资助项目: 国家自然科学基金项目(No.12101478,12171392)、陕西省自然科学基础研究计划项目(No.2025JC-YBMS-087)、陕西数理基础科学研究项目(No.23JSZ008)资助

摘要

属性约简是形式概念分析中的热点研究方向之一,研究其动态更新方法在知识发现领域具有重要意义.属性直观图是形式背景的Hasse图表示形式,通过属性直观图可得到保持概念格结构不变的属性约简.因此,文中针对形式背景中属性集变化情况,通过属性直观图的动态更新规律研究此类属性约简的动态更新方法.首先,通过属性的上(下)近邻关系给出属性直观图关系矩阵的定义,并研究该关系矩阵的性质.然后,针对删除属性和增加属性两种情况,分别给出基于关系矩阵的属性直观图的更新方法.最后,借助属性直观图的更新规律给出属性特征的变化规律,进而得到属性约简的动态更新方法.该方法进一步丰富属性约简理论,数值实验说明该方法的有效性.

关键词: 属性约简; 属性直观图; 关系矩阵; 属性特征; 动态更新

中图分类号:TP182

Dynamic Update of Attribute Reduction Based on Property Pictorial Diagrams

BAI Pu¹, WAN Qing^1,², MA Yingcang¹, WEI Ling^2,³

1. School of Science, Xi'an Polytechnic University, Xi'an 710048

2. Institute of Concepts, Cognition and Intelligence, Northwest University, Xi'an 710127

3. School of Mathematics, Northwest University, Xi'an 710127

Corresponding author:
WAN Qing, Ph.D., associate professor. Her research interests include formal concept analysis, rough set theory and granular computing.

About Author:
BAI Pu, Master student. Her research interests include formal concept analysis and granular computing.
MA Yingcang, Ph.D., professor.His research interests include rough set theory, machine learning and intelligent computing.
WEI Ling, Ph.D., professor. Her research interests include formal concept analysis, rough set theory and probability theory.

Fund:Supported by National Natural Science Foundation of China(No.12101478, 12171392), Natural Science Basic Research Plan of Shaanxi Province(No.2025JC-YBMS-087), Shaanxi Fundamental Science Research Project for Mathematics and Physics(No.23JSZ008)

Abstract

Attribute reduction is a prominent research focus in formal concept analysis, and exploring its dynamic update methods is crucial for knowledge discovery. The property pictorial diagram, a Hasse diagram representation of a formal context, can be employed to derive attribute reducts that preserve the concept lattice structure. In this paper, dynamic update methods for attribute reduction are investigated under the changes in the attribute set of a formal context by analyzing the update rules of the property pictorial diagram. First, a relation matrix for the property pictorial diagram is defined using the upper(lower) neighborhood relations among attributes, and its properties are studied. Then, update methods for the property pictorial diagram are proposed based on the relation matrix for two cases: attribute deletion and attribute addition. Finally, based on the update rules of the property pictorial diagram, change rules of attribute characteristics are given, and then dynamic update methods for attribute reduction are developed. The proposed methods further enrich the theoretical foundation of attribute reduction and numerical experiments demonstrate their effectiveness.

Key words: Attribute Reduction; Property Pictorial Diagram; Relation Matrix; Attribute Characteristics; Dynamic Update

文章图片

自Wille于1982年提出形式概念分析(Formal Concept Analysis, FCA)^{[1, 2]}以来, 该理论已受到学者们的广泛关注.在FCA中, 形式背景和形式概念是其基础定义, 由形式概念的全体在一定偏序关系下形成的Hasse图是该理论的一个核心结构, 被称为概念格.目前, FCA已广泛应用于概念认知学习^{[3, 4, 5]}、机器学习^{[6, 7]}及冲突分析^{[8, 9]}等领域.

属性约简作为FCA的重要研究方向之一, 一直备受学者关注.属性约简的本质是在保持形式背景中某种特性不变的前提下通过删除冗余属性以降低数据维度, 从而使知识的表达更简洁清晰.关于属性约简, 有保持概念格结构不变的属性约简^[10]、保持概念格中交(并)不可约元外延不变的属性约简^{[11, 12]}、保持对象粒概念外延不变的属性约简^[13].此外, 学者们还将属性约简这一思想应用于不同类型的形式背景和概念格中以简化知识表示^{[14, 15, 16, 17]}.另外, 类似于属性约简的思想, 曹丽等^[18]和魏玲等^[19]从保持形式背景中二元关系不变的角度提出概念约简.Liang等^[20]进一步将概念约简应用于概念认知学习.特别值得一提的是, Wan等^[21]证明从补背景保持概念格结构不变的属性约简可获得原形式背景的概念约简, 揭示属性约简与概念约简之间的一种内在联系.

随着大数据时代的到来, 数据动态变化已成为常态, 知识的动态更新研究也随之成为学者们关注的焦点.在FCA框架下, 已有学者关注不同类型的概念更新方法^{[22, 23]}、决策规则更新方法^[24]和属性约简更新方法^{[25, 26, 27]}.属性约简的动态更新研究现阶段主要集中在粒约简方面.曾惠坤等^[25]提出在形式背景中添加单个属性或多个属性时粒约简的更新方法.Niu等^[26]定义属性重要性, 在决策背景中提出粒约简的更新方法.Li等^[27]从图论的角度提出粒约简的更新方法.但是, 目前对于保持概念格结构不变的属性约简的动态更新研究相对较少.

属性直观图是形式背景的一种Hasse图的描述方式, 能直观展示属性与属性之间的关系, 从而得到保持概念格结构不变的属性约简^[28].进一步地, 利用属性直观图还可得到三支概念格属性特征的判别方法^[29].此外, 还可通过直观图在模糊技能形式背景中建立面向知识结构分析的模糊概念格模型^[30].

本文旨在通过属性直观图研究保持概念格结构不变的属性约简更新方法.首先, 通过属性的上(下)近邻关系给出属性直观图关系矩阵的定义, 并研究该关系矩阵的性质.然后, 针对删除属性和增加属性两种情况, 分别给出基于关系矩阵的属性直观图的更新方法.最后, 借助属性直观图的更新规律给出属性特征的变化规律, 进而得到属性约简的动态更新方法.该方法进一步丰富属性约简理论, 数值实验说明该方法的有效性.

1 预备知识

定义1^[1] 设(G, M, R)为形式背景, 其中:

G={g₁, g₂, …, g_q}

表示对象集, 每个g_i(i≤ q)表示一个对象;

M={m₁, m₂, …, m_p}

表示属性集, 每个m_j(j≤ p)表示一个属性; R表示G和M之间的二元关系, R⊆G× M.若(g, m)∈ R, 则表示对象g具有属性m.

在形式背景(G, M, R)中, 对于∀ A⊆G, B⊆M, Wille提出一对诱导算子:

A^*={m∈ M|∀ g∈ A, (g, m)∈ R},

B'={g∈ G|∀ |m∈ B, (g, m)∈ R},

其中, A^*表示A中所有对象共同具有的属性集合, B'表示共同具有B中所有属性的对象集合.当二元组(A, B)满足A^*=B且B'=A时, 称(A, B)为形式概念, 简称为概念, 并称A为概念的外延, B为概念的内涵.

记L(G, M, R)为形式背景(G, M, R)的所有概念的集合.对

∀ (A₁, B₁)∈ L(G, M, R), (A₂, B₂)∈ L(G, M, R),

定义偏序关系:

(A₁, B₁)⩽(A₂, B₂)⇔ A₁⊆A₂(⇔ B₁⊇B₂).

继而(L(G, M, R), ⩽)构成完备格, 称为概念格, 简记为L(G, M, R).

定义2^[10] 设(G, M, R)为形式背景.若∃F⊆M, 使得

L(G, F, R_F)≅L(G, M, R),

则称F为(G, M, R)的属性协调集.进一步, 若∀ d∈ F满足

L(G, F-{d}, R_F_-{_d_})≇L(G, M, R),

则称F为(G, M, R)的属性约简, 其中

R_F=R∩ (G× F).

定义2中的属性约简便是保持概念格结构不变的属性约简.在不引起混淆的情况下, 本文简称为属性约简.

定义3^[10] 设形式背景(G, M, R)的所有属性约简为{F_i|F_i为属性约简, i∈ τ }, 其中τ 为一个指标集.属性集M中的属性可分为3类.

1)核心:

$C=\bigcap_{i \in \tau} F_{i}, $

C中的每个属性称为核心属性.

2)相对必要属性集:

$X=\cup_{i \in \tau} F_{i}-\bigcap_{i \in \tau} F_{i}, $

X中的每个属性称为相对必要属性.

3)绝对不必要属性集:

$I=M-\underset{i\in \tau }{\mathop \cup }\, {{F}_{i}}, $

I中的每个属性称为绝对不必要属性.

根据相对必要属性的特点, 若形式背景对应的数表没有两列数值完全相同时, 即没有相同列, 则属性集上的属性仅被分为两类:核心属性和绝对不必要属性.此时, 如果得到绝对不必要属性集, 也就得到核心, 即得到属性约简.因此, 万青^[28]通过属性直观图给出属性特征的判别方法, 具体如下.

定义4^[28] 设(G, M, R)为形式背景.记

H_M={(m', m)|m∈ M},

对∀ m_s∈ M, m_t∈ M, 若m'_s⊆m'_t, 则记

(m'_s, m_s)⩽(m'_t, m_t),

称(H_M, ⩽)为(G, M, R)的属性直观图.

记(H_M, ⩽)的极大元集合为Max(H_M), 极小元集合为Min(H_M).需要特别说明的是, 定义4中的属性直观图是指偏序集(H_M, ⩽)的Hasse图.此外, 本文后续研究的形式背景均假定其没有相同的列, 即属性集上的属性仅分为核心属性和绝对不必要属性.

定义5^[2] 若a、b满足条件a< b且不存在c使得a< c< b成立, 则称a为b的下近邻, 同时称b为a的上近邻, 记作a≺b.

基于定义5, 在形式背景(G, M, R)中, ∀ m_i∈ M, m_j∈ M, 若

(m'_i, m_i)≺(m'_j, m_j),

则称m_j为m_i的上近邻或称m_i为m_j的下近邻. 此外, 记属性m的上近邻为

UN_m={m_j∈ M|(m', m)≺(m'_j, m_j)},

下近邻为

LN_m={m_i∈ M|(m'_i, m_i)≺(m', m)}.

定理1^[28] 设(G, M, R)为形式背景, (H_M, ⩽)为该形式背景的属性直观图.∀ m∈ M, 则

m∈ I⇔ (m', m)∉Max(H_M)

且

$ \bigcap_{m_{s} \in U N_{m}} m_{s}^{\prime}-m^{\prime}=\emptyset .$

实质上, 定理1给出基于属性直观图获取属性约简的方法, 此方法的关键是计算属性的上近邻.

例1 给定形式背景(G, M, R)如表1所示, 其中对象集

G={1, 2, 3, 4, 5, 6},

属性集

M={m₁, m₂, m₃, m₄, m₅, m₆, m₇, m₈}.

对于表1, 根据定义4, 可得其属性直观图(H_M, ⩽)如图1所示.

	Figure Option View Download New Window
	图1 表1的属性直观图(H_M, ⩽)Fig.1 Property pictorial diagram(H_M, ⩽)of Table 1

从图1可得

Max(H_M)={(12345, m₁), (2346, m₆), (12356, m₈)}.

因此, 根据定理1可知如果需要求出表1的属性约简, 仅需求出m₂, m₃, m₄, m₅和m₇的上近邻即可.

表1 形式背景(G, M, R) Table 1 Formal context(G, M, R)

对于属性m₂、m₃、m₄、m₅、m₇, 其上近邻为

$ U N_{m_{2}}=\left\{m_{1}, m_{8}\right\}, U N_{m_{3}}=\left\{m_{5}, m_{7}\right\}, $

$ U N_{m_{4}}=\left\{m_{2}, m_{5}\right\}, U N_{m_{5}}=\left\{m_{1}, m_{6}\right\}, $

$ U N_{m_{7}}=\left\{m_{6}\right\}, $

因为

$ \cap_{m_{s} \in U N_{m_{2}}} m_{s}^{\prime}-m_{2}^{\prime}=\{1, 2, 3, 5\}-\{2, 3, 5\} \neq \emptyset, $

故由定理1可知m₂∉I.类似地, 可验证m₄∉I.而

$ \bigcap_{m_{s} \in U N_{m_{3}}} m_{s}^{\prime}-m_{3}^{\prime}=\{2, 4\}-\{2, 4\}=\emptyset, $

故由定理1可知m₃∈ I.类似地还可验证m₅∈ I.特别地, 因为

$ U N_{m_{7}}=\left\{m_{6}\right\}, \left|U N_{m_{7}}\right|=1, $

故一定有

$ \bigcap_{m_{s} \in U N_{m_{7}}} m_{s}^{\prime}-m_{7}^{\prime} \neq \emptyset $

所以通过定理1可知m₇∉I.

综上可得, 表1的绝对不必要属性集为

I={m₃, m₅}.

于是表1的核心为

C=M-I={m₁, m₂, m₄, m₆, m₇, m₈},

即属性约简为

F={m₁, m₂, m₄, m₆, m₇, m₈}.

2 属性直观图的动态更新

为了研究属性直观图的动态更新规律, 下面先依据属性之间的上(下)近邻关系, 给出属性直观图关系矩阵的定义.

定义6 设(H_M, ⩽)为形式背景(G, M, R)的属性直观图,

M={m₁, m₂, …, m_p}.

记

R_≺={< m_i, m_j> |(m'_i, m_i)≺(m'_j, m_j)},

称R_≺为属性的上(下)近邻关系, $D = (d_{ij})_{p \times p}$ 为(H_M, ⩽)的关系矩阵, 其中

$d_{ij} = \{\begin{array}{l} 1, & < m_{i}, m_{j} > \in R_{≺} \\ 0, & 其它 \end{array}$

上述定义中属性直观图的关系矩阵D, 实质上是在(H_M, ⩽)作为偏序集时的关系矩阵中去除自反性与传递性之后得到的, 这些特点可描述如下.

性质1 设(H_M, ⩽)为形式背景(G, M, R)的属性直观图, $D = (d_{ij})_{p \times p}$ 为(H_M, ⩽)的关系矩阵, 则有

1)∀ m_i∈ M, d_ii=0.

2)∀ m_i∈ M, m_j∈ M, 若 ${d_{i}}_{j}$ =1, 则 ${d_{j}}_{i}$ =0; 反之亦然.

3)∀ m_i∈ M, m_s∈ M, m_t∈ M, 若d_is=1且d_st=1, 则d_it=0.

由于从属性直观图可直接得到每个属性的上(下)近邻, 即该Hasse图中有连边的两个节点之间对应属性之间的上(下)近邻关系.由于属性直观图与其关系矩阵是一一对应的, 因此可从关系矩阵D出发得到每个属性的上(下)近邻, 进而得到(H_M, ⩽)的极大元与极小元.相关结论如下所示.

性质2 设(H_M, ⩽)为形式背景(G, M, R)的属性直观图, D= $(d_{ij})_{p \times p}$ 为(H_M, ⩽)的关系矩阵, 则如下结论成立:

1)∀ m_j∈ M,

$\sum_{k=1}^{p} d_{k j}=0 \Leftrightarrow\left(m_{j}^{\prime}, m_{j}\right) \in \operatorname{Min}\left(H_{M}\right) ; $

2)∀ m_i∈ M,

$\sum_{k=1}^{p} d_{i k}=0 \Leftrightarrow\left(m_{i}^{\prime}, m_{i}\right) \in \operatorname{Max}\left(H_{M}\right) .$

证明先证1).∀ m_j∈ M, 若

$\sum_{k=1}^{p} d_{k j}=0$

则有

d₁_j=d₂_j=…=d_pj=0,

进而根据定义6可知, ∀ k∈ {1, 2, …, p}, 都有

< m_k, m_j> ∉R_≺,

即m_j无下近邻, 因此

(m'_j, m_j)∈ Min(H_M).

反之也是成立的.

再证2).类似于1)的证明过程.

例2 对于例1的属性直观图(H_M, ⩽), 由图1可知

(m'₂, m₂)≺(m'₁, m₁),

即

< m₂, m₁> ∈ R_≺,

所以根据定义6可得 ${d_{2}}_{1}$ =1.类似地, 依次可得

d₂₈=d₃₅=d₃₇=d₄₂=d₄₅=d₅₁=d₅₆=d₇₆=1.

其余属性之间没有上(下)近邻关系R_≺, 于是该关系矩阵中其余元素均为0.综上可得(H_M, ⩽)的关系矩阵为:

$D = (\begin{array}{l} 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 1 & 0 & 0 & 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 0 \\ 1 & 0 & 0 & 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{array})$ .

反之, 在关系矩阵D中, 因其第2行第1列和第2行第8列元素为1, 即

d₂₁= d₂₈=1,

所以可知m₂的上近邻为m₁和m₈, 即

U $N_{m_{2}}$ ={m₁, m₈}.

又由于D的第1列中

d₂₁=d₅₁=1,

故m₁的下近邻为m₂和m₅, 即

L $N_{m_{1}}$ ={m₂, m₅}.

类似地, 通过关系矩阵也可得到其它属性的上(下)近邻.

进一步地, 在关系矩阵D中, 因

$ \sum_{k=1}^{8} d_{k 3}=\sum_{k=1}^{8} d_{k 4}=0$

$ \sum_{k=1}^{8} d_{1 k}=\sum_{k=1}^{8} d_{6 k}=\sum_{k=1}^{8} d_{8 k}=0$

故可知(m'₃, m₃)、(m'₄, m₄)为极小元, (m'₁, m₁)、(m'₆, m₆)、(m'₈, m₈)为极大元.

下面针对形式背景中属性集的动态变化(删除一个属性和增加一个属性), 基于(H_M, ⩽)的关系矩阵D分析属性直观图的变化规律.

2.1 删除属性时(H_M, ⩽)的动态更新

为了方便描述, 下文将原形式背景记为(G, M^t, R^t), 其属性直观图记为 $(H_{M^{t}}, ⩽)$ , 对应的关系矩阵记为 $D^{t} = (d_{ij}^{t})_{p \times p}$ .将删除属性后的形式背景记为(G, M^t^-1, R^t^-1), 其属性直观图记为 $(H_{M^{t - 1}}, ⩽)$ , 对应的关系矩阵记为

$D^{t - 1} = (d_{ij}^{t - 1})_{(p - 1) \times (p - 1)}$ .

记属性m在 $(H_{M^{t}}, ⩽)$ 中的上近邻为U $N_{m}^{t}$ , 下近邻为L $N_{m}^{t}$ , $R_{≺}^{t}$ 为 $(H_{M^{t}}, ⩽)$ 中的上(下)近邻关系, $R_{≺}^{t - 1}$ 为 $(H_{M^{t - 1}}, ⩽)$ 中的上(下)近邻关系.

下面先给出从原形式背景的属性集M^t中删除属性m_k之后D^t和D^t^-1之间的关系.

定理2 设 $(H_{M^{t}}, ⩽)$ 为(G, M^t, R^t)的属性直观图, $D^{t} = (d_{ij}^{t})_{p \times p}$ 为 $(H_{M^{t}}, ⩽)$ 的关系矩阵, m_k为删除属性,

$D^{t - 1} = (d_{ij}^{t - 1})_{(p - 1) \times (p - 1)}$

为 $(H_{M^{t - 1}}, ⩽)$ 的关系矩阵.∀ m_i∈ M^t-{m_k}, 若 $d_{ik}^{t} = 1$ , 且存在m_j∈ M^t-{m_k}有 $d_{kj}^{t}$ =1, 而且满足

$U N_{m_{i}}^{t} \cap L N_{m_{j}}^{t}=\left\{m_{k}\right\}, $

则 $d_{ij}^{t - 1}$ =1.

证明 ∀ m_i∈ M^t-{m_k}, 当 $d_{ik}^{t} = 1$ 且存在

m_j∈ M^t-{m_k}

有 $d_{kj}^{t}$ =1时, 由定义6知在( $H_{M^{t}}$ , ⩽)中有

< m_i, m_k> ∈ $R_{≺}^{t}$ , < m_k, m_j> ∈ $R_{≺}^{t}$ ,

继而有

m'_i⊂m'_k⊂m'_j.

又由于

$U N_{m_{i}}^{t} \cap L N_{m_{j}}^{t}=\left\{m_{k}\right\}, $,

因此可知一定不存在

m∈ M^t-{m_k},

使得

m'_i⊂m'⊂m'_j,

所以当删除属性m_k后, 有

(m'_i, m_i)≺(m'_j, m_j),

于是根据定义6可得 $d_{ij}^{t - 1}$ =1.

定理2揭示在形式背景中删除一个属性时, 属性集中其余属性上近邻的变化规律.基于定理2, 当删除属性m_k时, 记

$D^{t \to t - 1} = (d_{ij}^{t \to t - 1})_{p \times p}$

为由D^t到D^t^-1的过渡矩阵, 其中

$d_{ij}^{t \to t - 1} = \{\begin{array}{l} 1, & m_{i} 、 m_{j} 满足定理 2 \\ d_{ij}^{t}, & 其它 \end{array}$

于是, 在过渡矩阵D^t^→^t^-1的基础上, 删除D^t^→^t^-1中的第k行与第k列便可得到删除属性m_k后的关系矩阵:

$D^{t - 1} = (d_{ij}^{t - 1})_{(p - 1) \times (p - 1)}$ .

注1 由于在从D^t得到D^t^-1的过程中删除第k行和第k列, 此时, 对∀ m_i∈ M^t^-1, 若i≥ k, 则D^t^-1中的第i行(第i列)对应的属性与D^t的第i+1行(第i+1列)对应的属性一致.

下面举例解释当在属性集M^t中删除属性m_k时属性直观图的更新方法.

例3 当在例1所示的形式背景中删除属性m₂时, 获取( $H_{M^{t - 1}}$ , ⩽)的过程描述如下.

首先, 根据定理2对D^t中元素进行更新, 得到过渡矩阵

${{D}^{t}}^{\to t-1}={{(d_{ij}^{t\to t-1})}_{p\times p}}.$

因在D^t中只有 $d_{42}^{t}$ =1, 且

$d_{21}^{t} = 1$ , $d_{28}^{t} = 1$ ,

以及由

$UN_{{{m}_{4}}}^{t}=\{{{m}_{2}}, {{m}_{5}}\}, $

$LN_{{{m}_{1}}}^{t}=\{{{m}_{2}}, {{m}_{5}}\}, LN_{{{m}_{8}}}^{t}=\{{{m}_{2}}\}$

可得

$UN_{{{m}_{4}}}^{t}\cap LN_{{{m}_{1}}}^{t}=\{{{m}_{2}}, {{m}_{5}}\}, $

$UN_{{{m}_{4}}}^{t}\cap LN_{{{m}_{8}}}^{t}=\{{{m}_{2}}\}.$

故根据定理2可知, $d_{48}^{t \to t - 1}$ =1.于是可得过渡矩阵:

$D^{t \to t - 1} = (\begin{array}{l} 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 1 & 0 & 0 & 0 & 0 & 0 & 0 & 1 \\ 0 & 0 & 0 & 0 & 1 & 0 & 1 & 0 \\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 0 / 1 \\ 1 & 0 & 0 & 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{array})$ .

其次, 在D^t^→^t^-1中删除第2行和第2列, 可得

$D^{t - 1} = (\begin{array}{l} 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 1 & 0 & 1 & 0 \\ 0 & 0 & 0 & 1 & 0 & 0 & 1 \\ 1 & 0 & 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 1 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 \end{array}) .$

最后, 根据定义6由D^t^-1和 $(H_{M^{t}}, ⩽)$ 得到属性直观图 $(H_{M^{t - 1}}, ⩽)$ 如图2所示.

	Figure Option View Download New Window
	图2 属性直观图 $(H_{M^{t - 1}}, ⩽)$ Fig.2 Property pictorial diagram $(H_{M^{t - 1}}, ⩽)$

2.2 增加属性时(H_M, ⩽)的动态更新

本文约定新增属性m_p₊₁∉M^t且不存在m_j∈ M^t有

m'_p₊₁=m'_j,

并将新增属性后的形式背景记为(G, M^t⁺¹, R^t⁺¹), 对应的属性直观图记为( $H_{M^{t + 1}}$ , ⩽), 关系矩阵记为

$D^{t + 1} = (d_{ij}^{t + 1})_{(p + 1) \times (p + 1)}$ ,

上 (下)近邻关系记为 $R_{≺}^{t + 1}$ .

对于新增属性m_p₊₁, 类似于删除属性的情况, 根据D^t和D^t⁺¹的特点, 先构造由D^t到D^t⁺¹的过渡矩阵D^t^→^t⁺¹, 再由过渡矩阵D^t^→^t⁺¹得到D^t⁺¹.下面给出D^t与D^t⁺¹的前p行、前p列元素之间的关系.

引理1 设 $(H_{M^{t}}, ⩽)$ 为(G, M^t, R^t)的属性直观图, D^t= $(d_{ij}^{t})_{p \times p}$ 为 $(H_{M^{t}}, ⩽)$ 的关系矩阵, ${{m}_{p+1}}$为新增属性, D^t⁺¹为 $(H_{M^{t + 1}}, ⩽)$ 的关系矩阵.∀ m_l∈ M^t, 有如下结论成立:

1)若 $d_{l (p + 1)}^{t + 1} = 0$ , 则∀ j∈ {1, 2, …, p}, 有 $d_{lj}^{t + 1} = d_{lj}^{t}$ ;

2)若 $d_{l (p + 1)}^{t + 1} = 1$ , 且对于m_s∈ M^t, 有 $d_{(p + 1) s}^{t + 1} = 0$ , 则 $d_{ls}^{t + 1} = d_{ls}^{t}$ .

证明先证1).若 $d_{l (p + 1)}^{t + 1} = 0$ , 则由定义6知

< m_l, m_p₊₁> ∉ $R_{≺}^{t + 1}$ ,

进而可得

$U N_{m_{l}}^{t + 1} = U N_{m_{l}}^{t}$ ,

即对∀ j∈ {1, 2, …, p}有 $d_{lj}^{t + 1} = d_{lj}^{t}$ .

再证2).由定义6知当 $d_{l (p + 1)}^{t + 1} = 1$ 时

< m_l, m_p₊₁> ∈ $R_{≺}^{t + 1}$ ,

当 $d_{(p + 1) s}^{t + 1} = 0$ 时

< m_p₊₁, m_s> ∉ $R_{≺}^{t + 1}$ ,

此时分别针对 $d_{ls}^{t} = 0$ 和 $d_{ls}^{t} = 1$ 两种情况进行证明.

一方面, 当 $d_{ls}^{t} = 0$ 时, 由定义6得

< m_l, m_s> ∉ $R_{≺}^{t}$ ,

进而由定义5知m'_l⊄m'_s或存在m_v∈ M^t有

m'_l⊆m'_v⊆m'_s,

此时, 当增加属性 $m_{p + 1}$ 之后, m_l与m_s的上(下)近邻关系仍然保持不变, 即

< m_l, m_s> ∉ $R_{≺}^{t + 1}$ ,

故有 $d_{ls}^{t + 1} = 0$ , 即 $d_{ls}^{t + 1} = d_{ls}^{t}$ .

另一方面, 由 $d_{ls}^{t} = 1$ 可知

< m_l, m_s> ∈ $R_{≺}^{t}$ ,

即m'_l⊆m'_s且不存在m_v∈ M^t有

m'_l⊆m'_v⊆m'_s.

当增加属性 $m_{p + 1}$ 之后, 假设 $d_{ls}^{t + 1} = 0$ , 则有m'_l⊄m'_s或存在m_w∈ M^t⁺¹有

m'_l⊆m'_w⊆m'_s.

若m'_l⊄m'_s, 则与 $d_{ls}^{t} = 1$ 矛盾; 若存在m_w∈ M^t⁺¹有

m'_l⊆m'_w⊆m'_s,

则根据 $d_{ls}^{t} = 1$ 可知m_w∉M^t, 此时m_w=m_p₊₁, 即

m'_l⊆m'_p₊₁⊆m'_s.

进一步, 由

< m_l, m_s> ∈ $R_{≺}^{t}$

可知, 不存在m∈ M^t有

m'_p₊₁⊆m'⊆m'_s,

故 $d_{(p + 1) s}^{t + 1} = 1$ , 这与已知 $d_{(p + 1) s}^{t + 1} = 0$ 矛盾, 因此假设不成立, 即 $d_{ls}^{t + 1} = 1$ .于是可证 $d_{ls}^{t + 1}$ = $d_{ls}^{t}$ .

引理1揭示在形式背景中增加一个属性时, 原属性集上属性上近邻的变化规律.基于引理1及关系矩阵的性质, 在新增属性m_p₊₁后, 记D^t到D^t⁺¹的过渡矩阵为

$D^{t \to t + 1} = (d_{ij}^{t \to t + 1})_{(p + 1) \times (p + 1)}$ ,

其中

$d_{ij}^{t \to t + 1} = \{\begin{array}{l} d_{ij}^{t}, & i \leq p, j \leq p, \\ 1, & m'_{i} \subseteq m'_{j}, i = p + 1 或 j = p + 1 \\ 0, & 其它 \end{array}$

由过渡矩阵D^t^→^t⁺¹获取D^t⁺¹的方法如定理3所示.

定理3 设 $(H_{M^{t}}, ⩽)$ 为(G, M^t, R^t)的属性直观图, $D^{t} = (d_{ij}^{t})_{p \times p}$ 为 $(H_{M^{t}}, ⩽)$ 的关系矩阵, $m_{p + 1}$ 为新增属性, D^t^→^t⁺¹为过渡矩阵.∀ m_l∈ M^t, 则有如下结论成立.

1)若 $d_{(p + 1) l}^{t \to t + 1} = 1$ 且存在m_s∈ M^t有 $d_{ls}^{t \to t + 1} = 1$ , 则 $d_{(p + 1) s}^{t + 1} = 0$ .

2)若存在m_s∈ M^t有 $d_{ls}^{t \to t + 1} = 1$ 且 $d_{s (p + 1)}^{t \to t + 1}$ =1, 则 $d_{l (p + 1)}^{t + 1} = 0$ .

3)若 $d_{l (p + 1)}^{t \to t + 1}$ =1且存在m_s∈ M^t有 $d_{(p + 1) s}^{t \to t + 1} = 1$ , 则 $d_{ls}^{t + 1} = 0$ .

证明先证1).由 $d_{(p + 1) l}^{t \to t + 1} = 1$ 可得m'_p₊₁⊆m'_l.此时, 若存在m_s∈ M^t有 $d_{ls}^{t \to t + 1} = 1$ , 则表明 $d_{ls}^{t} = 1$ , 即m'_l⊆m'_s.于是, 由定义5和定义6可得在 $(H_{M^{t + 1}}, ⩽)$ 中

< m_p₊₁, m_s> ∉ $R_{≺}^{t + 1}$ ,

故 $d_{(p + 1) s}^{t + 1} = 0$ .

2)和 3) 均可用类似于1)的证明过程得证.

例4 当在例1所示的形式背景中增加属性m₉(m'₉={3, 4})时, 获取( $H_{M^{t + 1}}$ , ⩽)的过程如下.

首先, 在D^t的基础上按照下述方法添加新的一行和新的一列元素得到D^t^→^t⁺¹.因为

m'₉⊆m'₁, m'₉⊆m'₅, m'₉⊆m'₆

且

m'₉⊈m'_i , i∈ {2, 3, 4, 7, 8},

故

$d_{91}^{t \to t + 1} = d_{95}^{t \to t + 1} = d_{96}^{t \to t + 1} = 1$ ,

$d_{92}^{t \to t + 1} = d_{93}^{t \to t + 1} = d_{94}^{t \to t + 1} = d_{97}^{t \to t + 1} = d_{98}^{t \to t + 1} = 0$ .

又因m'₄⊆m'₉且m'_i⊈m'₉ , i∈ {1, 2, 3, 5, 6, 7, 8}, 故第9列中除了 $d_{49}^{t \to t + 1}$ =1以外其余元素均为0.于是可得过渡矩阵:

$D^{t \to t + 1} = (\begin{array}{l} 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 1 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 0 & 1 & 0 & 1 & 0 & 0 \\ 0 & 1 & 0 & 0 & 1 & 0 & 0 & 0 & 1 \\ 1 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 1 & 0 & 0 & 0 & 1 & 1 & 0 & 0 & 0 \end{array})$ .

其次, 利用定理3对过渡矩阵D^t^→^t⁺¹中的元素进行更新.因

$d_{95}^{t \to t + 1} = 1, d_{51}^{t \to t + 1} = 1, d_{56}^{t \to t + 1} = 1$ ,

故可得

$d_{91}^{t + 1} = d_{96}^{t + 1} = 0$ .

又因 $d_{49}^{t \to t + 1} = 1$ 且

$d_{91}^{t \to t + 1} = d_{95}^{t \to t + 1} = d_{96}^{t \to t + 1} = 1$ ,

故

$d_{41}^{t + 1} = d_{45}^{t + 1} = d_{46}^{t + 1} = 0$ .

综上可得

$D^{t + 1} = (\begin{array}{l} 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 1 & 0 & 0 & 0 & 0 & 0 & 0 & 1 & 0 \\ 0 & 0 & 0 & 0 & 1 & 0 & 1 & 0 & 0 \\ 0 & 1 & 0 & 0 & 1 / 0 & 0 & 0 & 0 & 1 \\ 1 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ 1 / 0 & 0 & 0 & 0 & 1 & 1 / 0 & 0 & 0 & 0 \end{array}) .$

最后, 根据定义6由关系矩阵D^t⁺¹和( $H_{M^{t}}$ , ⩽)可得属性直观图( $H_{M^{t + 1}}$ , ⩽)如图3所示.

	Figure Option View Download New Window
	图3 属性直观图 $(H_{M^{t + 1}}, ⩽)$ Fig.3 Property pictorial diagram $(H_{M^{t + 1}}, ⩽)$

3 属性约简的动态更新

由于利用属性直观图的关系矩阵可得到每个属性的上近邻, 于是结合定理1, 可得基于属性直观图关系矩阵D的属性特征的判断方法如下.

定理4 设(H_M, ⩽)为形式背景(G, M, R)的属性直观图, D= $(d_{ij})_{p \times p}$ 为(H_M, ⩽)的关系矩阵.∀ m_i∈ M, 有

${{m}_{i}}\in I\Leftrightarrow \overset{p}{\mathop{\underset{j=1}{\mathop \sum }\, }}\, {{d}_{ij}}\ge 2$

且

$\underset{{{m}_{s}}\in U{{N}_{{{m}_{i}}}}}{\mathop \cap }\, m{{'}_{s}}-m{{'}_{i}}= \emptyset $,

其中

$U{{N}_{{{m}_{i}}}}=\{{{m}_{j}}\in M|{{d}_{ij}}=1\}$.

证明 $\forall m_{i} \in M$, 若

$\overset{p}{\mathop{\underset{k=1}{\mathop \sum }\, }}\, {{d}_{ik}}\ge 2$,

则有

$\left| U{{N}_{{{m}_{i}}}} \right|\ge 2, $

即

(m'_i, m_i)∉Max(H_M).

又因为

$\bigcap_{m_{s} \in U N_{m_{i}}} m_{s}^{\prime}-m_{i}^{\prime}=\emptyset, $

故根据定理1可知, m_i∈ I.

若m_i∈ I, 则由定理1可得

(m'_i, m_i)∉Max(H_M),

$\bigcap_{m_{s} \in U N_{m_{i}}} m_{s}^{\prime}-m_{i}^{\prime}=\emptyset .$

而由

(m'_i, m_i)∉Max(H_M)

可知 $| U N_{m_{i}} | \geq 1$ .当 $| U N_{m_{i}} | = 1$ 时, 有

$\bigcap_{m_{s} \in U N_{m_{i}}} m_{s}^{\prime}-m_{i}^{\prime} \neq \emptyset$

因此 $| U N_{m_{i}} | \geq 2$ , 即

$\sum_{j=1}^{p} d_{i j} \geqslant 2$.

例5 由例2中图1所示属性直观图(H_M, ⩽)的关系矩阵可知

$\sum_{j=1}^{8} d_{1 j}=\sum_{j=1}^{8} d_{6 j}=\sum_{j=1}^{8} d_{8 j}=0< 2 $,

$\sum_{j=1}^{8} d_{7 j}=1< 2 $.

因此依据定理4可得

m₁∉I, m₆∉I, m₇∉I, m₈∉I.

又因为

$\sum_{j=1}^{8} d_{2 j}=\sum_{j=1}^{8} d_{3 j}=\sum_{j=1}^{8} d_{4 j}=\sum_{j=1}^{8} d_{5 j}=2 $,

于是, 依据定理4需进一步对m₂、m₃、 m₄、m₅进行判断, 所得结果为

m₂∉I, m₄∉I, m₃∈ I, m₅∈ I.

由上述过程可知, 例1和例5的结果完全一致, 而且从例5的计算过程可发现, 相比定理1, 定理4不需要对只有一个上近邻的属性进行判断, 可简化部分计算.

算法1给出基于定理4获取属性约简的具体过程, 时间复杂度为O(|M|²|G|).

算法1 基于属性直观图关系矩阵的属性约简算法

输入形式背景(G, M, R)

输出属性约简 F

initialize D← zeros(p, p), F← Ø , I← Ø

for m_i∈ M

for m_j∈ M

if < m_i, m_j> ∈ R_≺

d_ij← 1

else

d_ij← 0

end if

end for

$D \leftarrow (d_{ij})_{p \times p}$

for m_l∈ M

if $ \sum_{j=1}^{p} d_{l j} \geqslant 2 \wedge \bigcap_{m_{s} \in U N_{m_{l}}} m_{s}^{\prime}-m_{l}^{\prime}=\emptyset$

I← I∪ {m_l}

end if

end for

F← M-I

return F

下面将在属性直观图动态变化规律的基础上分析属性特征的变化规律.在此, 将原形式背景的核心记为C^t, 绝对不必要属性集记为与I^t; 删除属性m_k之后对应的核心记为C^t^-1, 绝对不必要属性集记为I^t^-1; 新增属性 $m_{p + 1}$ 之后对应的核心记为C^t⁺¹, 绝对不必要属性集记为I^t⁺¹.

在 $(H_{M^{t - 1}}, ⩽)$ 中, 记属性m的上近邻为U $N_{m}^{t - 1}$ , 在 $(H_{M^{t + 1}}, ⩽)$ 中记属性m的上近邻为 $U N_{m}^{t + 1}$ .

3.1 删除属性时属性约简的更新规律

本节基于D^t^-1的更新规律, 研究属性特征的更新规律, 进而得到属性约简的更新方法.

对于属性m_k, 若

$\sum_{i=1}^{p} d_{i k}^{t}=0$,

意味着m_k不是其它任何属性的上近邻, 此时删除属性m_k, 对其它属性而言定理4中的判定条件不发生改变, 那么其它属性的属性特征就不发生变化.基于此特点, 当删除属性m_k时, 可从D^t中第k列的值出发考虑其余属性的属性特征变化规律.

定理5 设 $(H_{M^{t}}, ⩽)$ 为(G, M^t, R^t)的属性直观图, $D^{t} = (d_{ij}^{t})_{p \times p}$ 为 $(H_{M^{t}}, ⩽)$ 的关系矩阵, C^t与I^t分别为(G, M^t, R^t)的核心和绝对不必要属性集, m_k为删除属性.∀ m_i∈ M^t-{m_k}, 有如下结论成立.

1)当 $d_{ik}^{t} = 0$ 时, 若m_i∈ C^t, 则m_i∈ C^t^-1; 若m_i∈ I^t, 则m_i∈ I^t^-1.

2)当 $d_{ik}^{t} = 1$ 时, 若m_i∈ C^t, 则m_i∈ C^t^-1.

证明先证1).因为 $d_{ik}^{t}$ =0, 故由定理2可知

$ \sum_{j=1}^{p-1} d_{i j}^{t-1}=\sum_{j=1}^{p} d_{i j}^{t} $

且

$U N_{m_{i}}^{t - 1} = U N_{m_{i}}^{t}$ ,

进而由定理4可得m_i的属性特征保持不变, 即当m_i∈ C^t时, m_i∈ C^t^-1; 当m_i∈ I^t时, m_i∈ I^t^-1.

再证2).若 $d_{ik}^{t}$ =1且m_i∈ C^t, 则由定理4可知

$\sum_{j=1}^{p} d_{i j}^{t}=1 $

或

$\sum_{j=1}^{p} d_{i j}^{t}> 1 $

且

$\bigcap_{m_{s} \in U N_{m_{i}}^{t}} m_{s}^{\prime}-m_{i}^{\prime} \neq \emptyset $

当

$\sum_{j=1}^{p} d_{i j}^{t}=1 $

时, 则由定理2可知

$\overset{p-1}{\mathop{\underset{j=1}{\mathop \sum }\, }}\, d_{ij}^{t-1}=1$

或

$\overset{p-1}{\mathop{\underset{j=1}{\mathop \sum }\, }}\, d_{ij}^{t-1}=0, $

即

$|U N_{m_{i}}^{t - 1}| = 1$

或

$|U N_{m_{i}}^{t - 1}| = 0,$

因此由定理4可得m_i∈ C^t^-1.当

$\overset{p}{\mathop{\underset{j=1}{\mathop \sum }\, }}\, d_{ij}^{t}> 1$

且

$\bigcap_{m_{s} \in U N_{m_{i}}^{t}} m_{s}^{\prime}-m_{i}^{\prime} \neq \emptyset$

时, 此时假设

$UN_{{{m}_{i}}}^{t}=\{{{m}_{k}}, {{m}_{r}}\}, $

则有

m'_i⊆m'_k, m'_i⊆m'_r

且

m'_k∩ m'_r-m'_i≠ Ø ,

于是可知

m'_i⊂m'_k∩ m'_r.

另外, 当删除属性m_k时, 由定理2可知

$UN_{{{m}_{i}}}^{t-1}\subseteq UN_{{{m}_{k}}}^{t}\cup \{{{m}_{r}}\}, $

于是

$\bigcap_{m_{l} \in U N_{m_{k}}^{t} \cup\left\{m_{r}\right\}} m_{l}^{\prime} \subseteq \bigcap_{m_{q} \in U N_{m_{i}}^{t-1}} m_{q}^{\prime}$

又因为

$m_{k}^{\prime} \subseteq \bigcap_{m_{i} \in U N_{m_{k}}^{t}} m_{i}^{\prime}$,

故有

$m_{i}^{\prime} \subset m_{k}^{\prime} \cap m_{r}^{\prime} \subseteq \bigcap_{m_{l} \in U N_{m_{k}}^{t} \cup\left\{m_{r}\right\}} m_{l}^{\prime} \subseteq \bigcap_{m_{q} \in U N_{m_{i}}^{t-1}} m_{q}^{\prime}$.

因此, 依据定理4可得m_i∈ C^t^-1.

定理5说明在删除属性m_k之后, 原形式背景的剩余属性中核心属性仍是新形式背景的核心属性.因此, 基于定理5, 要获取新形式背景的属性约简, 仅需要对原形式背景绝对不必要属性集上的部分属性, 利用定理4在更新后的关系矩阵中对其进行判断即可.

例6 在表1的形式背景中, 已知核心

C^t={m₁, m₂, m₄, m₆, m₇, m₈},

绝对不必要属性集

I^t={m₃, m₅}.

在表1中, 当删除属性m₂时, 由例2中的D^t可知

$d_{12}^{t} = d_{32}^{t} = d_{52}^{t} = d_{62}^{t} = d_{72}^{t} = d_{82}^{t} = 0$ ,

于是根据定理5中1)可得,

m₁∈ C^t^-1, m₆∈ C^t^-1, m₇∈ C^t^-1, m₈∈ C^t^-1,
m3_∈It^-¹^,m5_∈It^-¹^.

由于 $d_{42}^{t} = 1$ 且m₄∈ C^t, 故由定理5中2)可得,

m₄∈ C^t^-1.

综上所述, 当在表1所示形式背景中删除属性m₂后, 新形式背景的核心

C^t^-1={m₁, m₄, m₆, m₇, m₈},

绝对不必要属性集

I^t^-1={m₃, m₅},

属性约简

F^t^-1={m₁, m₄, m₆, m₇, m₈}.

可验证该结论与定理4所得结果一致.

基于定理2、定理4和定理5, 在形式背景中删除属性m_k时, 获取属性约简的过程记为算法2, 时间复杂度为

O(|I^t-{m_k}-I₀||M^t-{m_k}||G|).

算法2 删除m_k时属性约简的更新算法

输入 ( $H_{M^{t}}$ , ⩽), D^t= $(d_{ij}^{t})_{p \times p}$ , m_k, I^t

输出属性约简 F^t^-1

initialize F^t^-1← Ø , I₀← Ø , D^t^→^t^-1← zeros(p, p),

D^t^-1← zeros(p-1, p-1), I₁← Ø

for m_i∈ I^t-{m_k}

if $d_{ik}^{t}$ =0

I₀← I₀∪ {m_i}

end if

end for

if I₀=I^t-{m_k}

return F^t^-1← M^t-I^t-{m_k}

end if

for m_i∈ I^t-{m_k}-I₀

if $d_{ik}^{t}$ =1

for m_j∈ M^t-{m_k}

if $d_{kj}^{t}$ =1∧ U $N_{m_{i}}^{t}$ ∩ L $N_{m_{j}}^{t}$ ={m_k}

$d_{ij}^{t \to t - 1}$ ← 1

else

$d_{ij}^{t \to t - 1}$ ← $d_{ij}^{t}$

end if

end for

end if

end for

D^t^→^t^-1← $(d_{ij}^{t \to t - 1})_{p \times p}$

D^t^-1← 删除D^t^→^t^-1的第k行与第k列

for m_i∈ I^t-{m_k}-I₀

if $\sum_{j=1}^{p-1} d_{i j}^{t-1} \geqslant 2 \wedge \bigcap_{m_{s} \in U N_{m_{i}}^{t-1}} m_{s}^{\prime}-m_{i}^{\prime}=\emptyset$

I₁← I₁∪ {m_i}

end if

end for

F^t^-1← M^t-{m_k}-I₀-I₁

return F^t^-1

3.2 增加属性时属性约简的更新规律

由于在基于属性直观图的属性特征的判别方法中, 关键在于求出属性的上近邻, 因此针对增加一个属性的情况, 下面仍借助 ${D^{t}}^{+ 1}$ 的更新规律, 从关系矩阵 ${D^{t}}^{+ 1}$ 的列出发分析属性特征的变化规律, 进一步得到属性约简的更新方法.

定理6 设( $H_{M^{t}}$ , ⩽)为(G, M^t, R^t)的属性直观图, m_p₊₁为新增属性,

$D^{t + 1} = (d_{ij}^{t + 1})_{(p + 1) \times (p + 1)}$

为( $H_{M^{t + 1}}$ , ⩽)的关系矩阵, C^t与I^t分别为(G, M^t, R^t)的核心和绝对不必要属性集.∀ m_i∈ M^t, 有如下结论成立.

1)当 $d_{i (p + 1)}^{t + 1} = 0$ 时, 若m_i∈ C^t, 则m_i∈ C^t⁺¹; 若m_i∈ I^t, 则m_i∈ I^t⁺¹.

2)当 $d_{i (p + 1)}^{t + 1} = 1$ 时, 若m_i∈ I^t, 则m_i∈ I^t⁺¹.

证明类似于定理5可证.

定理6说明在增加属性${{m}_{p+1}}$时, 原形式背景的绝对不必要属性仍是新形式背景的绝对不必要属性.因此, 想要获取新形式背景的属性约简, 仅需对原形式背景核心中的部分属性及新增属性, 利用定理4在更新后的关系矩阵中对其进行判断即可.

例7 继续以例1的形式背景为例进行解释.

当在表1中增加属性m₉(m'₉={3, 4})时, 由例4中的D^t⁺¹知

$\begin{aligned} d_{1(p+1)}^{t+1}= & d_{2(p+1)}^{t+1}=d_{3(p+1)}^{t+1}=d_{5(p+1)}^{t+1}=d_{6(p+1)}^{t+1}= \\ & d_{7(p+1)}^{t+1}=d_{8(p+1)}^{t+1}=0 \end{aligned}$

于是由

C^t={m₁, m₂, m₄, m₆, m₇, m₈},

I^t={m₃_,m₅}

以及定理6中1)可得,

m₁∈ C^t⁺¹, m₂∈ C^t⁺¹, m₆∈ C^t⁺¹, m₇∈ C^t⁺¹, m₈∈ C^t⁺¹,

m₃∈ I^t⁺¹, m₅∈ I^t⁺¹.

对于属性m₄, 由例4的D^t⁺¹可知 $d_{49}^{t + 1}$ =1且m₄∉I^t, 因此进一步根据定理4判断m₄的属性特征.因

$d_{42}^{t + 1} = d_{49}^{t + 1} = 1$ ,

故

$U N_{m_{4}}^{t + 1} = {m_{2}, m_{9}}$ ,

进而有

$\bigcap_{m_{s} \in U N_{m_{4}}^{t+1}} m_{s}^{\prime}-m_{4}^{\prime}=\{3\}-\{3\}=\emptyset, $

于是根据定理4可得m₄∈ I^t⁺¹.

又因为

$\sum_{j=1}^{9} d_{9 j}^{t+1}=1< 2$,

故根据定理4可得新增属性m₉∉I^t⁺¹.

综上所述, 在增加m₉(m'₉={3, 4})之后, 新形式背景的核心

C^t⁺¹={m₁, m₂, m₆, m₇, m₈, m₉},

绝对不必要属性集

I^t⁺¹={m₃, m₄, m₅},

属性约简

F^t⁺¹={m₁, m₂, m₆, m₇, m₈, m₉}.

该结论可由定理4验证其正确性.

基于定理3、定理4和定理6, 在形式背景中增加属性${{m}_{p+1}}$时, 获取属性约简的过程记为算法3, 时间复杂度为

O(|C^t∪ {m_p₊₁}-C₀||M^t∪ {m_p₊₁}||G|).

算法3 增加${{m}_{p+1}}$时属性约简的更新算法

输入 ( $H_{M^{t}}$ , ⩽), D^t= $(d_{ij}^{t})_{p \times p}$ , (m'_p₊₁, m_p₊₁), C^t

输出属性约简 F^t⁺¹

initialize F^t⁺¹← Ø , D^t^→^t⁺¹← zeros(p+1, p+1),

D^t⁺¹← zeros(p+1, p+1), C₀← Ø , C₁← Ø

for m_i∈ M^t∪ {m_p₊₁}

for m_j∈ M^t∪ {m_p₊₁}

if i≤ p∧ j≤ p

$d_{ij}^{t \to t + 1} \leftarrow d_{ij}^{t}$

else if m'_i⊆m'_j

$d_{ij}^{t \to t + 1} \leftarrow 1$

else

$d_{ij}^{t \to t + 1} \leftarrow 0$

end if

end for

D^t^→^t⁺¹← $(d_{ij}^{t \to t + 1})_{(p + 1) \times (p + 1)}$

for m_l∈ M^t

for m_s∈ M^t

if $d_{(p + 1) l}^{t \to t + 1} = 1 \land d_{ls}^{t \to t + 1} = 1$

$d_{(p + 1) s}^{t \to t + 1} \leftarrow 0$

end if

if $d_{ls}^{t \to t + 1} = 1 \land d_{s (p + 1)}^{t \to t + 1} = 1$

$d_{l (p + 1)}^{t \to t + 1} \leftarrow 0$

end if

if $d_{l (p + 1)}^{t \to t + 1} = 1 \land d_{(p + 1) s}^{t \to t + 1} = 1$

$d_{ls}^{t \to t + 1}$ ← 0

end if

end for

D^t⁺¹← D^t^→^t⁺¹

for m_i∈ C^t

if $d_{i (p + 1)}^{t + 1}$ =0

C₀← C₀∪ {m_i}

end if

end for

for m_i∈ C^t∪ {m_p₊₁}-C₀

if $\overset{p+1}{\mathop{\underset{j=1}{\mathop \sum }\, }}\, d_{ij}^{t+1}< 2$

C₁← C₁∪ {m_i}

else if $\bigcap_{m_{s} \in U N_{m_{i}}^{t+1}} m_{s}^{\prime}-m_{i}^{\prime} \neq \emptyset$

C₁← C₁∪ {m_i}

end if

end for

F^t⁺¹← C₀∪ C₁

return F^t⁺¹

4 实验及结果分析

本节评估本文的属性约简动态更新方法的有效性.针对算法1和文献[31]方法的对比, 数据采用随机生成的11个属性个数渐增(|M|=8, 9, …, 18, |G|=18)与11个对象个数渐增(|G|=8, 9, …, 18, |M|=18)的形式背景, 这些形式背景中的二元关系占比约为50%且无相同列.实验结果是取6次实验运行时间的平均值.

由于算法1在计算属性约简时不需要获取概念以及构建概念格, 因此时间复杂度为O(|M|²|G|)远低于文献[31]方法的时间复杂度 $O (| M |^{|G| \times |M|})$ .

算法1和文献[31]方法在属性渐增与对象渐增时的运行时间对比如表2和表3所示.

表2 属性渐增时各方法运行时间对比 Table 2 Comparison of running time among different methods during attribute increment s

表3 对象渐增时各方法运行时间对比 Table 3 Comparison of running time among different methods during object increment s

由表2和表3可见, 属性渐增时, 相比文献[31]方法, 算法1的耗时更少且增幅更平缓.对象渐增时, 算法1仍比文献[31]方法的耗时更少.由此可得, 在仅需要获取属性约简时, 算法1更适用于较大规模的数据.

针对算法1~算法3的对比, 选择4个UCI数据集和4个二元关系占比约为50%的随机生成的形式背景(无相同列), 具体信息如表4所示.此次实验结果仍是取6次实验运行时间的平均值.

表4 实验数据集信息 Table 4 Statistics of experimental datasets

由于UCI数据集上属性值大多数为多值的, 因此, 需对数据进行如下规范化的预处理.

1)对数据集上存在缺失值的情况, 删除缺失值

对应的行(Lung cancer、Spambase数据集).

2)针对数据集上的二值型变量, 保持原始数据不作调整(Zoo、Spambase数据集).

3)对于数据集上分类型的属性, 将其每个取值作为新的属性(Soybean、Lung cancer数据集).

4)对于数据集上存在连续值型的属性, 将属性值平均划分为3个区间, 将每个区间作为独立属性 (Spambase数据集).

此外, 在4个UCI数据集最终生成的形式背景中, 检查并删除所有完全重复的列, 确保属性集上的属性仅被分为核心属性和绝对不必要属性.

表5一方面记录各数据集上的核心属性个数和绝对不必要属性个数, 另一方面, 针对删除属性和增加属性两种情况, 分别记录删除属性和增加属性的属性特征、更新后对应的新形式背景的核心属性个数、绝对不必要属性个数及相应的算法耗时.

表5 属性特征的更新结果及相应算法耗时对比 Table 5 Update results of attribute characteristics and running time comparison of corresponding algorithms

数据集	$\|C^{t}\|$	$\|I^{t}\|$	删除属性					增加属性
数据集	$\|C^{t}\|$	$\|I^{t}\|$	m_k的属性特征	$\|C^{t - 1}\|$	$\|I^{t - 1}\|$	算法1 耗时	算法2 耗时	$m_{p + 1}$ 的属性特征	$\|C^{t + 1}\|$	$\|I^{t + 1}\|$	算法1 耗时	算法3 耗时
Zoo	16	0	C^t	15	0	0.236	0.136	C^t+1	16	1	0.203	0.139
Soybean	46	7	I^t	46	6	0.595	0.135	I^t+1	46	8	0.642	0.161
Lung cancer	73	31	C^t	75	28	1.693	0.178	C^t+1	74	31	1.774	0.282
Spambase	125	1	C^t	124	1	43.705	0.138	C^t+1	126	1	45.590	0.292
R1	358	2	I^t	358	1	44.075	0.711	C^t+1	359	2	44.699	0.958
R2	479	1	C^t	478	1	133.733	0.923	I^t+1	479	2	134.414	1.387
R3	599	1	C^t	598	1	325.326	1.344	I^t+1	599	2	325.522	2.200
R4	719	1	I^t	719	0	655.624	1.846	I^t+1	719	2	563.661	2.977

表5 属性特征的更新结果及相应算法耗时对比 Table 5 Update results of attribute characteristics and running time comparison of corresponding algorithms

由表5可知:当删除一个属性时,

|I^t^-1|≤ |I^t|,

即原形式背景中的绝对不必要属性可能变为新形式背景中的核心属性; 当增加一个属性时,

|I^t⁺¹|≥ |I^t|,

即原形式背景中的核心属性可能变为新形式背景中的绝对不必要属性.这进一步验证定理5与定理6的正确性.

相比静态方法(算法1), 当删除属性m_k时, 算法2仅需对原形式背景的绝对不必要属性集上的部分属性利用定理4判断其属性特征即可, 在最坏情况I₀=Ø 时, 算法2的时间复杂度为

O(|I^t-{m_k}||M^t-{m_k}||G|),

I^t-{m_k}⊆ M^t-{m_k},

也低于算法1的时间复杂度

O(|M^t-{m_k}|²|G|).

类似地, 当增加属性 $m_{p + 1}$ 时, 算法3仅需对原形式背景的核心中的部分属性及新增属性利用定理4判断其属性特征即可, 在最坏情况C₀=Ø 时, 算法3的时间复杂度为

O(|C^t∪ {m_p+1}||M^t∪ {m_p+1}||G|),

C^t∪ {m_p+1}⊆M^t∪ {m_p+1},

也低于算法1的时间复杂度

O(|M^t∪ {m_p+1}|²|G|).

动态更新方法(算法2和算法3)与静态方法(算法1)的耗时对比如图4所示.由图可看出, 随着属性个数的增加, 算法2和算法3的运行时间始终低于算法1, 并且相比算法1, 算法2和算法3的耗时增幅更平缓.由此表明, 在属性集发生改变时, 本文的属性约简的动态更新方法可提升计算效率.

	Figure Option View Download New Window
	图4 各算法的耗时对比Fig.4 Comparison of running time among different algorithms

5 结束语

本文借助属性直观图揭示当形式背景的属性集动态变化时属性特征的动态更新规律, 即删除属性时原形式背景的剩余属性中核心属性是新形式背景的核心属性, 增加属性时原形式背景的绝对不必要属性是新形式背景的绝对不必要属性, 继而得到属性约简的动态更新方法.具体地, 通过属性直观图的关系矩阵给出删除一个属性与增加一个属性时属性直观图的更新方法, 基于此利用属性直观图的关系矩阵得到属性特征的更新规律, 从而给出属性约简的更新算法, 并通过数值实验说明属性约简的动态更新方法的有效性, 可提高计算效率.

后续将针对删除对象和增加对象的情况, 基于属性直观图的关系矩阵研究属性约简的更新方法.此外, 基于属性约简与概念约简之间的联系, 可借助基于概念认知学习的图网络数据的节点分类方法, 将本文的属性约简的动态更新方法应用于动态图网络数据节点分类的更新问题上.

本文责任编委苗夺谦

Recommended by Associate Editor MIAO Duoqian

参考文献

文献选项

[1]	WILLE R. Restructuring Lattice Theory: An Approach Based on Hie-rarchies of Concepts // RIVAL I, ed. Ordered Sets. Berlin, Germany: Springer, 1982: 445-470. [本文引用:2]
[2]	GANTER B, WILLE R. Formal Concept Analysis: Mathematical Foun-dations. Berlin, Germany: Springer, 1999. [本文引用:2]
[3]	ZHANG X Y, GUO D D, XU W H. Two-Way Concept-Cognitive Learning with Multi-source Fuzzy Context. Cognitive Computation, 2023, 15(5): 1526-1548. [本文引用:1]
[4]	梁涛巨, 林艺东, 林梦雷, 等. 基于属性加权的概念认知学习模型. 模式识别与人工智能, 2023, 36(8): 749-763. (LIANG T J, LIN Y D, LIN M L, et al. Weighted Attributes-Based Concept-Cognitive Learning Model. Pattern Recognition and Artificial Intelligence, 2023, 36(8): 749-763. ) [本文引用:1]
[5]	徐伟华, 李金海, 折延宏. 概念认知学习理论与方法. 北京: 科学出版社, 2023. (XU W H, LI J H, SHE Y H. Concept-Cognitive Learning: Theories and Methods. Beijing, China: Science Press, 2023. ) [本文引用:1]
[6]	SHAO M W, HU Z Y, WU W Z, et al. Graph Neural Networks Induced by Concept Lattices for Classification. International Journal of Approximate Reasoning, 2023, 154: 262-276. [本文引用:1]
[7]	SALMAN H E. Leveraging a Combination of Machine Learning and Formal Concept Analysis to Locate the Implementation of Features in Software Variants. Information and Software Technology, 2023, 164. DOI: 10.1016/j.infsof.2023.107320. [本文引用:1]
[8]	ZHI H L, LI J H, LI Y N. Multi-level Conflict Analysis Based on Fuzzy Formal Contexts. IEEE Transactions on Fuzzy Systems, 2022, 30(12): 5128-5142. [本文引用:1]
[9]	LANG G M, YAO Y Y. Formal Concept Analysis Perspectives on Three-Way Conflict Analysis. International Journal of Approximate Reasoning, 2023, 152: 160-182. [本文引用:1]
[10]	ZHANG W X, WEI L, QI J J. Attribute Reduction Theory and Approach to Concept Lattice. Science in China(Information Sciences), 2005, 48(6): 713-726. [本文引用:3]
[11]	WANG X, ZHANG W X. Relations of Attribute Reduction Between Object and Property Oriented Concept Lattices. Knowledge-Based Systems, 2008, 21(5): 398-403. [本文引用:1]
[12]	LI T J, LI M Z, GAO Y. Attribute Reduction of Concept Lattice Based on Irreducible Elements. International Journal of Wavelets, Multiresolution and Information Processing, 2013, 11(6). DOI: 10.1142/S021969131350046X. [本文引用:1]
[13]	WU W Z, LEUNG Y, MI J S. Granular Computing and Knowledge Reduction in Formal Contexts. IEEE Transactions on Knowledge and Data Engineering, 2008, 21(10): 1461-1474. [本文引用:1]
[14]	REN R S, WEI L. The Attribute Reductions of Three-Way Concept Lattices. Knowledge-Based Systems, 2016, 99: 92-102. [本文引用:1]
[15]	CHEN J K, MI J S, XIE B, et al. Attribute Reduction in Formal Decision Contexts and Its Application to Finite Topological Spaces. International Journal of Machine Learning and Cybernetics, 2021, 12(1): 39-52. [本文引用:1]
[16]	NIU J J, CHEN D G, TIE W Y. Single Sample-Oriented Attribute Reduction for Rule Learning with Formal Concept Analysis. Infor-mation Sciences, 2024, 681. DOI: 10.1016/j.ins.2024.121243. [本文引用:1]
[17]	李同军, 吴明瑞, 吴伟志. 基于粗糙近似的经典-模糊概念格属性约简. 工程数学学报, 2025, 42(4): 736-750. (LI T J, WU M R, WU W Z. Attribute Reduction of Crisp-Fuzzy Concept Lattices Based on Rough Approximation Operations. Chinese Journal of Engineering Mathmatics, 2025, 42(4): 736-750. ) [本文引用:1]
[18]	曹丽, 魏玲, 祁建军. 保持二元关系不变的概念约简. 模式识别与人工智能, 2018, 31(6): 516-524. (CAO L, WEI L, QI J J. Concept Reduction Preserving Binary Relations. Pattern Recognition and Artificial Intelligence, 2018, 31(6): 516-524. ) [本文引用:1]
[19]	魏玲, 曹丽, 祁建军, 等. 形式概念分析中的概念约简与概念特征. 中国科学(信息科学), 2020, 50(12): 1817-1833. (WEI L, CAO L, QI J J, et al. Concept Reduction and Concept Characteristics in Formal Concept Analysis. Scientia Sinica Informationis, 2020, 50(12): 1817-1833. ) [本文引用:1]
[20]	LIANG T J, LIN Y D, LI J J, et al. Incremental Cognitive Lear-ning Approach Based on Concept Reduction. International Journal of Approximate Reasoning, 2025, 179. DOI: 10.1016/j.ijar.2024.109359. [本文引用:1]
[21]	WAN Q, HAO J H, ZHANG Y D, et al. Concept Reduction Method Based on Attribute Concept Reduction Method Based on Attribute(Object) Reduction // Proc of the 11th International Joint Conference on Rough Sets. Berlin, Germany: Springer, 2025, II: 436-449. [本文引用:1]
[22]	YAN M Y, LI J H. Knowledge Discovery and Updating Under the Evolution of Network Formal Contexts Based on Three-Way Decision. Information Sciences, 2022, 601: 18-38. [本文引用:1]
[23]	HU Q, QIN K Y, YANG L. The Updating Methods of Object-Induced Three-Way Concept in Dynamic Formal Contexts. Applied Intelligence, 2023, 53(2): 1826-1841. [本文引用:1]
[24]	YANG Y F, ZHANG R, LIU B X. Dynamic Parallel Mining Algorithm of Association Rules Based on Interval Concept Lattice. Ma-thematics, 2019, 7(7). DOI: 10.3390/math7070647. [本文引用:1]
[25]	曾惠坤, 米据生, 李仲玲. 形式背景中概念及约简的动态更新方法. 计算机科学, 2021, 48(1): 131-135. (ZENG H K, MI J S, LI Z L. Dynamic Updating Method of Concepts and Reduction in Formal Context. Computer Science, 2021, 48(1): 131-135. ) [本文引用:2]
[26]	NIU J J, CHEN D G. Incremental Calculation Approaches for Gra-nular Reduct in Formal Context with Attribute Updating. Interna-tional Journal of Machine Learning and Cybernetics, 2022, 13(9): 2763-2784. [本文引用:2]
[27]	LI Z L, MI J S, ZHANG T, et al. Attribute Selection Methods Based on Graph Theory in Updated Formal Contexts. International Journal of Machine Learning and Cybernetics, 2025, 16(5): 3211-3232. [本文引用:2]
[28]	万青. 基于直观图的概念格知识获取理论与方法. 博士学位论文. 西安: 西北大学, 2015. (WAN Q. Theories and Methods of Knowledge Acquisition for Concept Lattice Based on Pictorial Diagrams. Ph. D. Dissertation. Xi'an, China: Northwest University, 2015. ) [本文引用:4]
[29]	万青, 马盈仓, 李金海. 基于直观图的三支概念获取及属性特征分析. 计算机科学与探索, 2022, 16(12): 2879-2889. (WAN Q, MA Y C, LI J H. Three-Way Concept Acquisition and Attribute Characteristic Analysis Based on Pictorial Diagrams. Journal of Frontiers of Computer Science and Technology, 2022, 16(12): 2879-2889. ) [本文引用:1]
[30]	智慧来, 李金海. 面向知识结构分析的模糊概念格模型. 软件学报, 2024, 35(5): 2466-2484. (ZHI H L, LI J H. Fuzzy Concept Lattice Models for Knowledge Structure Analysis. Journal of Software, 2024, 35(5): 2466-2484. ) [本文引用:1]
[31]	QI J J. Attribute Reduction in Formal Contexts Based on a New Discernibility Matrix. Journal of Applied Mathematics and Computing, 2009, 30(1/2): 305-314. [本文引用:5]

1982

0.0

... 自Wille于1982年提出形式概念分析(Formal Concept Analysis, FCA)^[1,2]以来,该理论已受到学者们的广泛关注 ...

... 1 预备知识定义1^[1] 设(G,M,R)为形式背景,其中: ...

1999

0.0

... 自Wille于1982年提出形式概念分析(Formal Concept Analysis, FCA)^[1,2]以来,该理论已受到学者们的广泛关注 ...

... 定义5^[2] 若a、b满足条件a#cod#x0003C ...

2023

0.0