基于等势概念的网络形式概念获取

引用本文

艾森森, 万青, 李金海. 基于等势概念的网络形式概念获取. 模式识别与人工智能, 2025,38(5): 412-424
AI Sensen, WAN Qing, LI Jinhai. Network Formal Concepts Acquisition Based on Equiconcepts. PATTERN RECOGNITION AND ARTIFICIAL INTELLIGENCE, 2025,38(5): 412-424. 复制到剪切板

Doi: 10.16451/j.cnki.issn1003-6059.202505003
Permissions

《模式识别与人工智能》编辑部

基于等势概念的网络形式概念获取

艾森森¹, 万青^1,², 李金海^3,⁴

1.西安工程大学理学院西安 710048

2.西北大学概念、认知与智能研究中心西安 710127

3.昆明理工大学理学院昆明 650500

4.昆明理工大学数据科学研究中心昆明 650500

通讯作者:

万青,博士,副教授,主要研究方向为粗糙集、形式概念分析、粒计算等.E-mail:wqysbe@163.com.

作者简介:

艾森森,硕士研究生,主要研究形式概念分析.E-mail:sensenai@126.com.

李金海,博士,教授,主要研究方向为认知计算、粒计算、大数据分析、概念格、粗糙集等.E-mail:jhlixjtu@163.com.
第二十七届中国科协年会学术论文

收稿日期: 2025-05-12 接受日期: 2025-05-31

资助项目: 国家自然科学基金资助项目(No.12101478,62476114)、陕西省自然科学基础研究计划项目(No.2025JC-YBMS-087)资助

摘要

在图网络数据诱导的网络形式背景中,基于形式概念与半概念,引入集合连通性,得到全局网络形式概念与局部网络形式概念,而集合连通性与形式背景的等势概念之间具有密切关系,这两类网络形式概念与等势概念之间也必然存在关联性.因此,在网络形式背景中,文中首先借助等势概念,提出获取对象集的所有连通子集的方法,并通过概念诱导算子刻画连通集的性质.然后,提出由原形式背景等势概念获取子背景等势概念的方法,进而得到由子背景的等势概念获取全局网络形式概念和局部网络形式概念的方法.最后,通过数值实验表明文中两类网络形式概念获取方法的有效性和可行性.

关键词: 网络形式概念; 形式概念; 半概念; 等势概念; 完全连通集; 连通集

中图分类号:TP182

Network Formal Concepts Acquisition Based on Equiconcepts

AI Sensen¹, WAN Qing^1,², LI Jinhai^3,⁴

1. School of Science, Xi'an Polytechnic University, Xi'an 710048

2. Institute of Concepts, Cognition and Intelligence, Northwest University, Xi'an 710127

3. Faculty of Science, Kunming University of Science and Technology, Kunming 650500

4. Data Science Research Center, Kunming University of Science and Technology, Kunming 650500

Corresponding author:
WAN Qing, Ph.D., associate professor. Her research interests include rough set theory, formal concept analysis and granular computing.

About Author:
AI Sensen, Master student. His research interests include formal concept analysis.
LI Jinhai, Ph.D., professor. His research interests include cognitive computing, granular computing, big data analysis, concept la⁃ttice and rough sets.
Academic Papers of the 27th Annual Meeting of the China Association for Science and Technology

Fund:Supported by National Natural Science Foundation of China(No.12101478, 62476114), Natural Science Basic Research Plan in Shaanxi Province of China(No.2025JC-YBMS-087)

Abstract

In the network formal context induced by graph network data, global network formal concepts and local network formal concepts are obtained by introducing the set connectivity on the basis of formal concepts and semiconcepts respectively, and there is a close relationship between the set connectivity and the equiconcepts of the formal context. Therefore, there must be a correlation between the two types of network formal concepts and equiconcepts. In this paper, for network formal contexts, a method for obtaining all connected subsets of the object set is first proposed by means of the equiconcepts,and some properties of the connected sets are characterized through concept-induced operators. Next, a method is presented for deriving the equiconcepts of the subcontext from the equiconcepts of the original formal context. Subsequently, the methods for acquiring global network formal concepts and local network formal concepts are obtained from the equiconcepts of the subcontext. Finally, numerical experiments illustrate the effectiveness and feasibility of the proposed acquisition methods for the two types of network formal concepts.

Key words: Network Formal Concept; Formal Concept; Semiconcept; Equiconcept; Complete Connected Set; Connected Set

文章图片

形式概念分析(Formal Concept Analysis, FCA)^{[1, 2]}作为知识表示和数据分析的有效工具, 由Wille为重建格理论而提出.FCA的数据表示为一个二维交叉表, 称为形式背景.形式背景由对象集、属性集及两者之间的二元关系构成, 记为(U, A, I).在形式背景中定义概念诱导算子及概念之间的偏序关系, 可得到一个完备格, 称为概念格, 记为L(U, A, I), 体现概念之间的层级关系.FCA自提出之后, 一直备受学者关注, 现已应用于知识发现^{[3, 4]}、机器学习^{[5, 6]}、数据挖掘^[7]、软件工程^[8]、特征选择^{[9, 10]}及概念认知^{[11, 12]}等领域.

随着科技的快速发展, 产生的数据越来越多, 包含的信息也越来越复杂.例如:图网络数据不仅包含对象-属性信息, 还包含对象-对象信息.相比FCA中的形式背景, 此类数据可看作是在形式背景的基础上增加对象与对象之间的信息, 故将此类数据称为网络形式背景, 记为(U, A, M, I), 其中M表示对象与对象之间的信息.这种数据表示方式有助于将复杂网络分析和FCA有效结合, 从概念认知的角度^[13]挖掘网络数据中更多隐藏的知识和规律.刘文星等^[14]在网络形式背景中结合网络结构与节点属性方式信息, 给出网络节点中心度和中心势的定义, 并结合网络结构和属性信息, 提出网络社区划分方法.Fan等^[15]将复杂网络分析与三支决策统一在一个框架下, 提出三支决策的网络形式背景, 并研究基于置信度的双向规则提取算法和约简算法.范敏等^[16]在网络形式背景中, 通过变精度弱概念集, 提出基于因果力的邻域推荐算法.闫梦宇等^[17]和Yan等^[18]基于网络形式背景, 在概念(三支概念)的基础上引入集合的连通性, 提出全局网络形式概念(全局网络OE-概念)和局部网络形式概念(局部网络OE-概念)的定义, 并在此基础上利用这类特殊的概念研究网络节点的分类问题.需要强调的是, 在网络形式背景(U, A, M, I)中提出的这类网络形式概念, 是在形式背景(U, A, I)中概念和半概念的基础上增加对象子集是连通集这一条件, 而这一条件的判定依赖于对象与对象之间的信息M.

社会网络是由个体组成的点状网络拓扑结构, 个体与个体之间存在各种相互依赖的社会关系, 在拓扑网络中用边表示这种关系, 因此社会网络通常可表示为一个图, 该图的顶点集是个体的集合, 边集是个体与个体之间的关系.Hao等^[19]将FCA引入社会网络分析中, 将图转化为由顶点与顶点构成的形式背景(U, U, R), 利用该形式背景中的特殊概念— — 等势概念检测符号社交网络中k-平衡可信派系.之后, Hao等^[20]将FCA引入k-派系检测问题中, 证明k-等势概念和k-派系之间一一对应, 并利用k-等势概念和k-内涵概念, 提出k-派系和k-派系社团的检测方法.此外, Hao等^[21]还利用等势概念和极大派系之间的特殊关系, 提出基于FCA的社会网络多元化top-k极大社团的挖掘算法.需要特别说明的是, 上述文献中提到的派系均是完全连通图, 即从节点和节点构成的形式背景中得到的等势概念可用于获取完全连通图.

事实上, 网络形式背景(U, A, M, I)中对象与对象之间的信息M就是社会网络分析中顶点与顶点构成的形式背景(U, U, R)中的二元关系R.因此, 基于网络形式背景的这一特点, 本文在文献[17]和文献[20]的基础上, 借助(U, U, R)中的等势概念, 先提出对象子集是否为连通集的判别方法, 再提出全局网络形式概念和局部网络形式概念的获取方法.

1 相关知识

1.1 形式概念分析

定义1^{[1, 2]} 称(U, A, I)为一个形式背景, 其中:

$ U=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\}$

为对象集, 每个x_i(i≤ n)表示一个对象;

$ A=\left\{a_{1}, a_{2}, \cdots, a_{m}\right\}$

为属性集, 每个a_j(j≤ m)表示一个属性; I为U和A之间的二元关系, I⊆U× A.若(x, a)∈ I, 则表示对象x具有属性a, 记为xIa; 若(x, a)∉I, 则表示对象x不具有属性a.

设(U, A, I)为一个形式背景, 在对象子集X⊆U和属性子集B⊆A上分别定义概念诱导算子* 如下:

$ \begin{array}{l} X^{* }=\{a \mid a \in A, \forall x \in X, (x, a) \in I\}, \\ B^{* }=\{x \mid x \in U, \forall a \in B, (x, a) \in I\}, \end{array}$

其中, X^*表示集合X中所有对象共同具有的属性集合, B^*表示共同具有集合B中所有属性的对象集合.

设(U, A, I)为一个形式背景, X⊆U, B⊆A.如果二元组(X, B)满足X^*=B, X=B^*, 则称(X, B)为一个形式概念, 简称概念, 其中, X表示概念的外延, B表示概念的内涵.记L(U, A, I)为形式背景(U, A, I)中所有概念的集合.

定义2^[19] 设(U, A, I)为一个形式背景, X⊆U, B⊆A.如果二元组(X, B)满足X^*=B, X=B^*且X=B, 则称(X, B)为一个等势概念, 其中, X表示等势概念的外延, B表示等势概念的内涵.记EL(U, A, I)为形式背景(U, A, I)中所有等势概念的集合.

定义3^{[1, 2]} 设(U, A, I)为一个形式背景, H⊆U, N⊆A.记

$ I_{H \times N}=I \cap(H \times N) \text {, }$

称(H, N, I_H_×_N)为(U, A, I)的子背景.

在子背景(H, N, I_H_×_N)中, ∀ Y⊆H, C⊆N, 将概念诱导算子* 记为Y^{* N}, C^{* H}.事实上, 由* 算子的定义可知

Y^{* N}=Y^*∩ N, C^{* H}=C^*∩ H.

1.2 图论

图通常表示为一个二元对G=(V, E), 其中, V表示图G中顶点的集合, E表示图G中边的集合.对于图G的两个顶点v_i∈ V, v_j∈ V, 若v_i、v_j之间存在一条边, 则表示为< v_i, v_j> ∈ E.对于图G的任意非空顶点子集V₁⊂V, 称以V₁为顶点集, 以G中两个端点都在V₁中、边为其边集的图为V₁的导出子图, 记为G[V₁].

定义4^[22] 设G=(V, E)为一个图, 称图G为连通的当且仅当对于图G的任意两个顶点v_i∈ V, v_j∈ V, 从顶点v_i出发, 经过若干个中间顶点, 能到达顶点v_j.特别地, 若对于任意的x_i∈ V, x_j∈ V, 都有< x_i, x_j> ∈ E, 则称图G为完全连通图.

1.3 网络形式背景

网络是由节点和连接这些节点的线组成的系统, 这些节点表示顶点, 线表示边, 通常表示为图G=(V, E).对于一个简单无向图G, 定义修正邻接矩阵M=(m_ij)如下^[20]:

$ m_{i j}=\left\{\begin{array}{ll} 1, & \left\langle v_{i}, v_{j}\right\rangle \in E, i \neq j \text { 或 } v_{i}=v_{j} \\ 0, & \text { 其它 } \end{array}\right.$

结合形式背景(U, A, I)和以对象集U为顶点集的图G=(U, E)的修正邻接矩阵, 所得的表格称为网络形式背景(也称为带对象结构信息形式背景).在网络形式背景中不仅包含对象与对象之间的信息, 同时也包含对象与属性之间的信息, 其详细定义

如下所示.

定义5^[17] 称四元组(U, A, M, I)为一个网络形式背景, 其中

U={x₁, x₂, …, x_n}

为对象集,

A= {a₁, a₂, …, a_m}

为属性集, M=(m_ij)为对象集U上的结构矩阵(即对象集对应的修正邻接矩阵); I为U和A之间的二元关系, 若(x, a)∈ I, 则表示对象x具有属性a, 记为xIa; 若(x, a)∉I, 则表示对象x不具有属性a.

定义6^[17] 设(U, A, M, I)为一个网络形式背景, X⊆U, X≠ Ø .若由集合X在结构矩阵M中诱导的子图G[X]是连通的, 则称X是连通的, 此时也称X为对象集U的连通子集.

在定义6中, 若X的导出子图G[X]是完全连通的, 则称X为U的完全连通子集.进一步地, 若不存在对象集U的完全连通子集Y, 使得X⊂Y, 此时称X为对象集U的极大完全连通子集.特别地, 单点集和二元连通子集都是U的完全连通子集.

定义7^[17] 设(U, A, M, I)为一个网络形式背景, X⊆U, B⊆A(X≠ Ø 且B≠ Ø ).

1)若X^*=B, X=B^*且X是连通的, 则称(X, B)为全局网络形式概念.记N(U, A, M, I)为(U, A, M, I)的所有全局网络形式概念的集合.

2)若X^*=B, X为连通的且不存在x∈ B^*-X使得X∪ {x}连通, 则称(X, B)为局部网络形式概念.记N_L(U, A, M, I)为(U, A, M, I)的所有局部网络形式概念的集合.

由定义7可知, 若(X, B)为(U, A, M, I)的全局网络形式概念, 则(X, B)一定为(U, A, I)的概念, 也一定为(U, A, M, I)的局部网络形式概念, 即

N(U, A, M, I)⊆L(U, A, I), N(U, A, M, I)⊆NL₍U, A, M, I).

例1 图1为一个学术网络图, 每个顶点表示一个对象, 顶点旁边为该对象具有的属性信息, 边表示学者之间存在学术交流关系.

	Figure Option View Download New Window
	图1 学术网络图Fig.1 Academic network graph

表1为图1对应的网络形式背景(U, A, M, I), 对象集

U={x₁, x₂, x₃, x₄, x₅, x₆},

表1 网络形式背景(U, A, M, I) Table 1 Network formal context(U, A, M, I)

属性集

A={a₁, a₂, a₃, a₄, a₅}.

在表1中, 形式背景(U, A, I)概念的集合为:

$ \begin{aligned} L(U, A, I)= & \left\{(\emptyset, A), \left(x_{1}, a_{2} a_{3} a_{5}\right), \left(x_{4} x_{5} x_{6}, a_{1} a_{4} a_{5}\right), \right. \\ & \left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right), \left(x_{1} x_{3}, a_{2} a_{3}\right), \\ & \left(x_{1} x_{5}, a_{3} a_{5}\right), \left(x_{1} x_{6}, a_{2} a_{5}\right), \\ & \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right), \left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right), \\ & \left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right), \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right), \\ & \left.\left(x_{1} x_{3} x_{5}, a_{3}\right), \left(x_{1} x_{4} x_{5} x_{6}, a_{5}\right), (U, \emptyset)\right\} . \end{aligned}$

全局网络形式概念的集合为:

$ \begin{aligned} N(U, A, M, I)= & \left\{\left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right), \left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right), \right. \\ & \left(x_{1}, a_{2} a_{3} a_{5}\right), \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right), \\ & \left(x_{1} x_{3}, a_{2} a_{3}\right), \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right), \\ & \left(x_{1} x_{5}, a_{3} a_{5}\right), \left(x_{1} x_{6}, a_{2} a_{5}\right), \\ & \left.\left(x_{1} x_{3} x_{5}, a_{3}\right), \left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right)\right\} . \end{aligned}$

局部网络形式概念的集合为:

$ \begin{array}{l} N_{L}(U, A, M, I)=N(U, A, M, I) \cup \\ \quad\left\{\left(x_{5} x_{6}, a_{1} a_{4} a_{5}\right), \left(x_{4}, a_{1} a_{4} a_{5}\right), \left(x_{1} x_{5} x_{6}, a_{5}\right)\right\} . \end{array}$

2 基于概念诱导算子的连通性分析

本文将对象集U上的结构矩阵M称为对象集U的形式背景, 记为(U, U, R), 即∀ x_i∈ U, x_j∈ U, 若m_ij=1, 则(x_i, x_j)∈ R; 若m_ij=0, 则(x_i, x_j)∉R.

因此, 网络形式背景(U, A, M, I)可看作是由形式背景(U, U, R)和(U, A, I)合并而成的数据集, 于是本文将网络形式背景记为(U, A, R, I).为了不引起混淆, 在形式背景(U, A, I)上用符号* 表示概念诱导算子, 在形式背景(U, U, R)上用符号'表示概念诱导算子.∀ X⊆U, X'表示与X中所有对象都有边连接的对象的集合.特别地, 记{x}'为x', x'表示与x有边连接的所有对象的集合.

在网络形式背景(U, A, R, I)中, 可由概念诱导算子'得到的等势概念获取U的所有完全连通子集.

引理1^[21] 设(U, A, R, I)为一个网络形式背景, EL(U, U, R)为(U, U, R)的等势概念集合, 则对象集U的所有极大完全连通子集为

{Y|(Y, C)∈ EL(U, U, R)}.

进一步地, 对象集U的所有完全连通子集为

{X|X⊆Y, (Y, C)∈ EL(U, U, R)}.

下面通过概念诱导算子'给出完全连通子集的性质.

性质1 设(U, A, R, I)为一个网络形式背景, X⊆U(X≠ Ø )为对象集U的完全连通子集.∀ x∈ U-X, 若x∈ X', 则X∪ {x}为对象集U的完全连通子集.

证明 ∀ x∈ U-X, 若x∈ X', 则由'算子的定义可得, ∀ y∈ X, 都有(x, y)∈ R, 所以x、y之间存在一条边, 由y的任意性知, x与X中的每个对象之间都存在一条边.又因为X为对象集U的完全连通子集, 所以∀ x_i∈ X∪ {x}, x_j∈ X∪ {x}, x_i、x_j之间都存在一条边.于是, 由完全连通集的定义可证明X∪ {x}为对象集U的完全连通子集.

在图论中, 由于一个连通集(连通图)可表示为它的两个交非空的连通子集(连通子图)的并, 即若X⊆U为连通子集当且仅当存在U的两个连通子集X₁、X₂, 满足X₁∩ X₂≠ Ø 且X₁∪ X₂=X.此特点称为连通图的分解性.因此, 在引理1的基础上, 下面给出由等势概念获取对象集U的所有连通子集的方法.

定理1 设(U, A, R, I)为一个网络形式背景, EL(U, U, R)为(U, U, R)的等势概念的集合, F₀, F₁, …, $F_{|U| - 1}$ 为对象集U的一个子集族序列, 其中

$ \begin{array}{c} \mathcal{J}_{0}=\left\{Y_{i}^{0}\left|Y_{i}^{0} \subseteq Y, (Y, C) \in E L(U, U, R), \left|Y_{i}^{0}\right| \geqslant 2\right\}, \right. \\ \mathcal{J}_{1}=\left\{Y_{i}^{0} \cup Y_{j}^{0} \mid Y_{i}^{0} \cap Y_{j}^{0} \neq \emptyset \text { 且 } Y_{i}^{0} \in \mathcal{J}_{0}, Y_{j}^{0} \in \mathcal{J}_{0}\right\}, \\ \vdots \\ \mathcal{J}_{|U|-1}=\left\{Y_{i}^{|U|-2} \cup Y_{j}^{|U|-2} \mid Y_{i}^{|U|-2} \cap Y_{j}^{|U|-2} \neq \emptyset\right. \text { 且 } \\ Y_{i}^{\left.|U|^{-2} \in \mathcal{J}_{|U|-2}, Y_{j}^{|U|^{-2}} \in \mathcal{J}_{|U|-2}\right\} .} \end{array}$

若存在一个r∈ {1, 2, …, $|U|$ -1}, 使得

F_r-F_r_-1=Ø ,

则对象集U的所有连通子集的集合为:

$ \Phi=\left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\bigcup_{i=0}^{r-1} \mathcal{F}_{i}\right), $

证明由引理1和连通图的分解性可知

$ \left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\cup_{i=0}^{r-1} \mathcal{F}_{i}\right) \subseteq \Phi .$

因此, 下面仅需证明

$ \Phi \subseteq\left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\bigcup_{i=0}^{r-1} \mathcal{F}_{i}\right) .$

∀ X∈ Φ , 当|X|=1时,

X∈ {{x_i}|x_i∈ U},

故X一定属于

$ \left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\cup_{i=0}^{r-1} \mathcal{F}_{i}\right) .$

当|X|≥ 2时, 由引理1可计算X的所有极大完全连通子集, 不妨设为

Ψ ₀={X₁, X₂, …, X_k},

则∀ X_i∈ Ψ ₀, X_i为U的完全连通子集, 所以X_i∈ F₀.若|Ψ ₀|=1, 显然有

Ψ ₀={X}⊆F₀.

否则, 对于任意给定的X_i∈ Ψ ₀, 假设∀ x_i∈ X_i, x_j∈ X-X_i, 有(x_i, x_j)∉R, 则由x_i、x_j的任意性可知, x_i不能经过若干顶点到达x_j, 这与X是连通的存在矛盾.因此, 存在x_i∈ X_i, x_j∈ X-X_i, 有(x_i, x_j)∈ R, 显然{x_i, x_j}为X的完全连通子集, 则存在X_j∈ Ψ ₀, 使得{x_i, x_j}⊆X_j且X_i≠ X_j.进而, 对于任意给定的X_i∈ Ψ ₀, 存在X_j∈ Ψ ₀-{X_i}, 有

X_i∩ X_j={x_i},

则

X_i∪ X_j∈ F₁.

记

Ψ ₁={X_i∪ X_j|X_i∩ X_j≠ Ø , ∀ X_i∈ Ψ ₀, X_j∈ Ψ ₀},

显然有Ψ ₁⊆F₁.

下面考虑集合Ψ ₁.若|Ψ ₁|=1, 则显然有

Ψ ₁={X}⊆F₁.

否则, 对于任意给定的Y_i∈ Ψ ₁, 假设∀ y_i∈ Y, ∀ y_j∈ X-Y_i, 都有(y_i, y_j)∉R, 则由y_i、y_j的任意性可知, y_i不能经过若干顶点到达y_j, 这与X是连通的存在矛盾.因此, 存在y_i∈ Y_i, y_j∈ X-Y_i, 使得(y_i, y_j)∈ R, 所以存在Y_j∈ Ψ ₁-{Y_i}, 使得{y_i, y_j}⊆Y_j.进一步可知, 对于任意给定的Y_i∈ Ψ ₁, 一定存在Y_j∈ Ψ ₁-{Y_i}, 有

Y_i∩ Y_j={y_i},

则

Y_i∪ Y_j∈ F₂.

记

Ψ ₂={Y_i∪ Y_j|Y_i∩ Y_j≠ Ø , ∀ Y_i∈ Ψ ₁, Y_j∈ Ψ ₁}.

下面考虑集合Ψ ₂.以此类推, 由X⊆U可知, 存在0≤ p≤ r, 使得|Ψ _p|=1, 即

Ψ _p={X}⊆F_p.

综上所述, ∀ X∈ Φ , 都有

$ X \in\left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\bigcup_{i=0}^{r-1} \mathcal{F}_{i}\right), $

所以

$ \Phi \subseteq\left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\bigcup_{i=0}^{r-1} \mathcal{F}_{i}\right) .$

基于定理1, 获取对象集U的连通子集的方法步骤如算法1所示.

算法1 对象集U的连通子集的获取方法

输入 EL(U, U, R)

输出对象集U的连通子集的集合Φ

初始化 Φ =Ø

F₀={ $Y_{i}^{0}$ | $Y_{i}^{0}$ ⊆Y, (Y, B)∈ EL(U, U, R), | $Y_{i}^{0}$ |≥ 2}

k=1∶ |U|-1, F_k=Ø

For $Y_{i}^{k - 1}$ in F_k_-1

For $Y_{j}^{k - 1}$ in F_k_-1

If $Y_{i}^{k - 1}$ ∩ $Y_{j}^{k - 1}$ ≠ Ø

F_k← F_k∪ { $Y_{i}^{k - 1}$ ∪ $Y_{j}^{k - 1}$ }

Φ ← Φ ∪ F_k

End if

End for

If F_k-F_k_-1=Ø

输出 Φ

End if

算法1的时间复杂度为O(mn2ⁿ+n²k²), 空间复杂度为O(mn2ⁿ+tnk²), 其中, m=|EL(U, U, R)|, n为等势概念外延集的平均大小, t为迭代次数, k=max F_k. 需说明的是, 算法1得到的Φ 不包含单点集.

定理1的特点是借助FCA给出对象集的所有连通子集的获取方法, 但该方法与图论中常见方法— — 深度优先搜索和广度优先搜索的时间复杂度是同一级别的.

下面以表1所示的网络形式背景为例, 解释对象集U的连通子集的获取方法.

例2 在表1中, 通过概念诱导算子可得形式背景(U, U, R)的概念集合:

$ \begin{aligned} L(U, U, R)= & \left\{(\emptyset, U), \left(x_{2}, x_{2} x_{4} x_{5} x_{6}\right), \left(x_{2} x_{4}, x_{2} x_{4}\right), \right. \\ & \left(x_{5} x_{6}, x_{1} x_{2} x_{3} x_{5} x_{6}\right), \left(x_{1} x_{2} x_{3} x_{5} x_{6}, x_{5} x_{6}\right), \\ & \left(x_{1} x_{3} x_{5} x_{6}, x_{1} x_{3} x_{5} x_{6}\right), \left(x_{2} x_{4} x_{5} x_{6}, x_{2}\right), \\ & \left.\left(x_{2} x_{5} x_{6}, x_{2} x_{5} x_{6}\right), (U, \emptyset)\right\} . \end{aligned}$

进一步可得形式背景(U, U, R)的等势概念集合:

$ E L(U, U, R)=\left\{\left(x_{2} x_{5} x_{6}, x_{2} x_{5} x_{6}\right), \left(x_{1} x_{3} x_{5} x_{6}, x_{1} x_{3} x_{5} x_{6}\right), \left(x_{2} x_{4}, x_{2} x_{4}\right)\right\} .$

根据EL(U, U, R), 先计算F₀,

F₀={x₁, x₃}, {x₁, x₅}, {x₁, x₆}, {x₂, x₄}, {x₂, x₅},

{x₂, x₆}, {x₃, x₅}, {x₃, x₆}, {x₅, x₆}, {x₁, x₃, x₅},

{x₁, x₃, x₆}, {x₂, x₅, x₆}, {x₃, x₅, x₆}, {x₁, x₅, x₆},

{x₁, x₃, x₅, x₆}.

基于F₀, 计算F₁,

F₁={x₁, x₂, x₅}, {x₁, x₂, x₆}, {x₁, x₃, x₅}, {x₁, x₂, x₃, x₅},

{x₁, x₃, x₆}, {x₁, x₅, x₆}, {x₂, x₃, x₅}, {x₁, x₂, x₃, x₆},

{x₂, x₃, x₆}, {x₂, x₄, x₅}, {x₂, x₄, x₆}, {x₁, x₂, x₅, x₆},

{x₂, x₅, x₆}, {x₃, x₅, x₆}, {x₁, x₂, x₃, x₅, x₆},

{x₁, x₃, x₅, x₆}, {x₂, x₃, x₅, x₆}, {x₂, x₄, x₅, x₆}.

因为F₁-F₀≠ Ø , 所以继续计算F₂,

F₂={x₁, x₂, x₃, x₅}, {x₁, x₂, x₃, x₆}, {x₁, x₂, x₃, x₄, x₅},

{x₁, x₂, x₄, x₅}, {x₁, x₂, x₄, x₆}, {x₁, x₂, x₃, x₄, x₆},

{x₁, x₂, x₅, x₆}, {x₁, x₃, x₅, x₆}, {x₁, x₂, x₃, x₅, x₆},

{x₂, x₃, x₄, x₅}, {x₂, x₃, x₄, x₆}, {x₁, x₂, x₄, x₅, x₆},

{x₂, x₃, x₅, x₆}, {x₂, x₄, x₅, x₆}, {x₂, x₃, x₄, x₅, x₆},

{x₁, x₂, x₃, x₄, x₅, x₆}.

又因为F₂-F₁≠ Ø , 于是继续计算F₃,

F₃={x₁, x₂, x₃, x₄, x₅}, {x₁, x₂, x₃, x₄, x₆},

{x1_,x2_,x3_,x5_,x6_}, {x1_,x2_,x4_,x5_,x6_},

{x2, _x3, _x4, _x5, _x6}_,{x1, _x2, _x3, _x4, _x5, _x6}_.

因为F₃-F₂=Ø , 故根据定理1可得对象集U的所有连通子集的集合:

Φ ={{x_i}|x_i∈ U}∪ F₀∪ F₁∪ F₂.

下面给出直接通过概念诱导算子'获取连通子集的方法.

定理2 设(U, A, R, I)为一个网络形式背景, x∈ U, y∈ U, 则有

1)x'为对象集U的连通子集;

2)若x'∩ y'≠ Ø , 则x'∪ y'为对象集U的连通子集.

证明先证1).∀ x_i∈ x', x_j∈ x', 由'算子的定义可知, (x_i, x)∈ R且(x_j, x)∈ R, 进而可得x_i、x之间存在一条边, x_j、x之间存在一条边, 因此x_i可经过x到达x_j, 由x_i、x_j的任意性可知, x'为U的连通子集.

再证2).根据连通图的分解性及1)中结论可证.

类似于性质1, 通过概念诱导算子'可得到连通子集的性质.

性质2 设(U, A, R, I)为一个网络形式背景, X⊆U(X≠ Ø )为对象集U的连通子集,

∀ x∈ $\cup_{x_{i}}^{\in}$ x'_i-X,

有X∪ {x}为U的连通子集.

证明由

x∈ $\cup_{x_{i}}^{\in}$ x'_i-X

可知, 至少存在一个x_i∈ X, 使得x∈ x'_i-X, 于是根据'算子的定义有, (x, x_i)∈ R.又因X为连通子集, 故可知x_i可经过若干顶点到达任意的x_j∈ X, 进而x可经过x_i到达任意的x_j∈ X, 因此可证X∪ {x}为对象集U的连通子集.

3 网络形式概念的获取方法

由定义7可知, 全局网络形式概念和局部网络形式概念分别是在概念和半概念的基础上引入集合的连通性而提出的, 因此获取这两类网络形式概念的一个关键问题是如何得到对象子集连通性判别的有效方法.由第2节可知, 等势概念与连通集具有密切的关系, 于是, 本节通过等势概念提出这两类网络概念的获取方法.

3.1 全局网络形式概念的获取方法

根据全局网络形式概念的定义可知, 要获取该类网络形式概念, 在(U, A, I)的概念已知的条件下, 只需判定(U, A, I)中概念外延是否为连通集即可.而由引理1可知, 由(U, U, R)的等势概念可直接获取所有的完全连通子集.因此, 基于(U, U, R)中概念, 可得如下定理.

定理3 设(U, A, R, I)为一个网络形式背景, L(U, U, R)为(U, U, R)的概念集合.对于任意的(X, B)∈ L(U, A, I)(X≠ Ø 且B≠ Ø ), 下列结论成立:

1)若存在(Y, C)∈ L(U, U, R), 有Y=C且X⊆Y, 则(X, B)为全局网络形式概念;

2)若存在(Y, C)∈ L(U, U, R), 有Y∩ C≠ Ø , 且X=Y或X=C, 则(X, B)为全局网络形式概念.

证明先证1).若存在(Y, C)∈ L(U, U, R), 使得Y=C, 则Y为U的极大完全连通子集.又因为X⊆Y, 由引理1可得, X为U的完全连通子集, 故(X, B)∈ L(U, A, I)为全局网络形式概念.

再证2).因为(Y, C)∈ L(U, U, R), 故可知∀ x∈ Y, ∀ y∈ C, 都有(x, y)∈ R.而由Y∩ C≠ Ø 可知, 一定存在z∈ Y∩ C, 即z∈ Y且z∈ C.因为z∈ C, 所以由概念的定义可知, ∀ x_i∈ Y, x_j∈ Y, 有(x_i, z)∈ R且(x_j, z)∈ R; 而z∈ Y, 所以x_i可经过z到达x_j, 进而由x_i、x_j的任意性可知, Y为U的连通子集, 同理可得, C为U的连通子集.因此可证, 当X=Y或X=C时, (X, B)∈ L(U, A, I)为全局网络形式概念.

定理3说明可从形式背景(U, U, R)中的概念得到一部分全局网络形式概念.为了进一步借助(U, U, R)中的等势概念给出获取所有全局网络形式概念的方法, 下面给出由(U, U, R)的等势概念获取其子背景(X, X, R_X)(X⊆U, R_X=R∩ (X× X))等势概念的方法.此前, 对于特定集合{(X, X)|X⊆U}, 本文规定其中任意两个元素之间的偏序关系为

(X₁, X₁)≤ (X₂, X₂) ⇔ X₁⊆X₂.

引理2 设(U, A, R, I)为一个网络形式背景, EL(U, U, R)为(U, U, R)的等势概念集合.对∀ X⊆U, 记

B={(X∩ X_i, X∩ B_i)|(X_i, B_i)∈ EL(U, U, R)},

则有

EL(X, X, R_X)=max B,

其中max B为偏序集(B, ≤ )的所有极大元的集合.

证明第一步证明EL(X, X, R_X)⊆max B.对∀ (Y, C)∈ EL(X, X, R_X), 首先证明(Y, C)∈ B.由(Y, C)∈ EL(X, X, R_X)可知, Y=C且Y⊆X为X的极大完全连通子集.进一步有Y为U的完全连通子集, 故存在U的一个极大完全连通子集X_i, 满足Y⊆X_i且

(X_i, B_i)∈ EL(U, U, R),

因此Y⊆X∩ X_i且X∩ X_i⊆X_i为X的完全连通子集.又因为Y为X的极大完全连通子集, 因此

Y=X∩ X_i,

进而有

C=X∩ B_i,

即∀ (Y, C)∈ EL(X, X, R_X), 存在(X_i, B_i)∈ EL(U, U, R), 使得

(Y, C)=(X∩ X_i, X∩ B_i)∈ B.

其次证明(Y, C)∈ max B.假设存在

(X∩ X_j, X∩ B_j)∈ B,

有

(Y, C)≤ (X∩ X_j, X∩ B_j),

即Y⊆X∩ X_j, 又因为Y为X的极大完全连通子集, 所以

Y=X∩ X_j,

因此(Y, C)∈ max B.故EL(X, X, R_X)⊆max B.

第二步证明max B⊆EL(X, X, R_X), 即证

∀ (X∩ X_i, X∩ B_i)∈ max B,

有(X∩ X_i, X∩ B_i)∈ L(X, X, R_X)且

X∩ X_i=X∩ B_i.

对于任意的(X∩ X_i, X∩ B_i)∈ max B, 由B的定义可知(X_i, B_i)∈ EL(U, U, R), 所以(X_i, B_i)∈ L(U, U, R), X_i=B_i且X_i× B_i⊆R.因为

(X∩ X_i)⊆X_i, (X∩ B_i)⊆B_i,

所以

(X∩ X_i)× (X∩ B_i)⊆R.

又因为

(X∩ X_i)⊆X, (X∩ B_i)⊆X,

故

(X∩ X_i)× (X∩ B_i)⊆X× X,

于是有

(X∩ X_i)× (X∩ B_i)⊆R∩ (X× X)=R_X,

从而根据概念诱导算子'的性质可知

(X∩ X_i)⊆ $(X ⋂ B_{i})^{'X}$ .

假设

(X∩ X_i)⊂ $(X ⋂ B_{i})^{'X}$ ,

即存在x∈ $(X ⋂ B_{i})^{'X}$ 且x∉X∩ X_i.由引理1可知X∩ B_i为X的完全连通子集.又x∈ $(X ⋂ B_{i})^{'X}$ , 由性质1可得(X∩ B_i)∪ {x}为X的完全连通子集.进一步可知(X∩ B_i)∪ {x}为U的完全连通子集, 所以一定存在(X_j, B_j)∈ EL(U, U, R), 使得

(X∩ B_i)∪ {x}⊆B_j .

又因为

(X∩ B_i)∪ {x}⊆X,

所以

(X∩ B_i)∪ {x}⊆X∩ B_j,

进而有

X∩ B_i⊂(X∩ B_i)∪ {x}⊆X∩ B_j,

即存在一个(X∩ X_j, X∩ B_j)∈ B, 使得

X∩ B_i⊂X∩ B_j,

与

(X∩ X_i, X∩ B_i)∈ max B

矛盾.因此,

X∩ X_i= $(X ⋂ B_{i})^{'X}$ .

同理可得

$(X ⋂ X_{i})^{'X}$ =X∩ B_i,

所以

(X∩ X_i, X∩ B_i)∈ L(X, X, R_X).

又因为X_i=B_i, 所以

X∩ X_i=X∩ B_i.

综上可得

(X∩ X_i, X∩ B_i)∈ EL(X, X, R_X),

进而有

max B⊆EL(X, X, R_X).

例3 针对表1的网络形式背景, 取对象子集

X={x₁, x₂, x₃, x₅},

根据定义3, 可得X在形式背景(U, U, R)中对应的子背景(X, X, R_X), 具体如表2所示.

表2 子背景(X, X, R_X) Table 2 A subcontext (X, X, R_X)

一方面, 由定义2, 根据概念诱导算子可得

EL(X, X, R_X)={(x₂x₅, x₂x₅), (x₁x₃x₅, x₁x₃x₅)}.

另一方面, 根据引理2 与例2可得

B={(x₂x₅, x₂x₅), (x₂, x₂), (x₁x₃x₅, x₁x₃x₅)},

进而有

max B={(x₂x₅, x₂x₅), (x₁x₃x₅, x₁x₃x₅)}.

于是可得

EL(X, X, R_X)=max B.

借鉴定理1的思路, 结合引理2, 可得由子背景的等势概念获取全局网络概念的方法.

定理4 设(U, A, R, I)为一个网络形式背景, EL(X, X, R_X)为子背景(X, X, R_X)的等势概念的集合.对任意的(X, B)∈ L(U, A, I)(X≠ Ø 且B≠ Ø ), 记M₀, M₁, …, $M_{|X| - 1}$ 为X的一个子集族序列, 其中

M₀={ $Y_{i}^{0}$ |( $Y_{i}^{0}$ , $C_{i}^{0}$ )∈ EL(X, X, R_X)},

M₁=

{ $Y_{i}^{1}$ =∪ { $Y_{j}^{0}$ | $Y_{i}^{0}$ ∩ $Y_{j}^{0}$ ≠ Ø , ∀ $Y_{j}^{0}$ ∈ M₀}|∀ $Y_{i}^{0}$ ∈ M₀},

︙

$M_{|X| - 1}$ ={ $Y_{i}^{|X| - 1}$ =∪ { $Y_{j}^{|X| - 2}$ | $Y_{i}^{|X| - 2}$ ∩ $Y_{j}^{|X| - 2}$ ≠ Ø ,

∀ $Y_{j}^{|X| - 2}$ ∈ $M_{|X| - 2}$ }|∀ $Y_{i}^{|X| - 2}$ ∈ $M_{|X| - 2}$ }.

则如下结论成立:

1)若存在0≤ k≤ |X|-1, 有|M_k|=1, 则(X, B)为全局网络形式概念;

2)若存在0≤ k≤ |X|-1, 有M_k_-1=M_k且|M_k|≥ 2, 则(X, B)不是全局网络形式概念.

证明由M_k的构造方法及连通图的分解性易知, M_k(0≤ k≤ |X|-1)中的元素都是X的连通子集, 对于任意的X⊆U(X≠ Ø ), X要么为U的连通子集, 要么为U的非连通子集.由M₀的有限性可知, 一定存在一个0≤ k≤ $|X|$ -1, 使得 $|M_{k}|$ =1, 或者M_k=M_k₊₁且 $|M_{k + 1}|$ ≥ 2.

先证1).当 $|M_{k}|$ =1时, 显然有M_k={X}.因此可知X是连通的, 进而可证(X, B)为全局网络形式概念.

2)当M_k=M_k₊₁且 $|M_{k + 1}|$ ≥ 2时, 由M_k(0≤ k≤ $|X|$ -1)的定义可知

M_k=M_k₊₁=…= $M_{|X| - 1}$ ,

且

$|M_{k}|$ = $|M_{k + 1}|$ = $|M_{k + 2}|$ =…= $|M_{|X| - 1}|$ ≥ 2.

不失一般性, 设

M_k={Y₁, Y₂, …, Y_t}, t≥ 2,

则显然有

$\overset{t}{⋃_{i = 1}}$ Y_i=X.

由M_k=M_k₊₁可知, ∀ Y_i∈ M_k, Y_j∈ M_k, Y_i≠ Y_j, 都有

Y_i∩ Y_j=Ø .

进一步地, 假设存在y_i∈ Y_i, y_j∈ X-Y_i, 使得(y_i, y_j)∈ R_X, 则{y_i, y_j}为X的完全连通子集, 进而存在Y_k∈ M_k, 使得{y_i, y_j}⊆Y_k.若Y_i=Y_k, 则y_j∈ Y_i, 这样存在矛盾.若Y_i≠ Y_k, 则Y_i∩ Y_k≠ Ø , 这样也存在矛盾.因此, ∀ y_i∈ Y_i, y_j∈ X-Y_i, 都有(y_i, y_j)∉R_X.由y_i、y_j的任意性可知, y_i不能经过若干顶点到达y_j, 所以X是不连通的, 进而可证(X, B)不是全局网络形式概念.

基于定理3和定理4, 下面给出从网络形式背景(U, A, R, I)出发获取全局网络形式概念的步骤.

1)计算L(U, A, I)和L(U, U, R).

2)对于任意的(X, B)∈ L(U, A, I)(X≠ Ø 且B≠ Ø ), 利用定理3判断其是否为全局网络形式概念, 并将由此得到的全局网络形式概念的集合记为N₁(U, A, R, I).

3)∀ (X, B)∈ L(U, A, I)-N₁(U, A, R, I)(X≠ Ø 且B≠ Ø ), 首先根据引理2获取子背景(X, X, R_X)的等势概念, 其次计算X的子集族序列

{M_k $|0 \leq k \leq |X| - 1$ },

最后根据定理4判断(X, B)是否为全局网络形式概念.

在3)中, 集合连通性的判定算法如下所示.

算法2 对象子集X的连通性判别

输入 EL(U, U, R), 线索集X

输出 True or False

初始化 M₀=Ø

根据引理2计算EL(X, X, R_X)

M₀=EL_X(X, X, R_X)

If |M₀|=1

返回True

Break

Else

k=1∶ |X|-1, M_k=Ø

For $Y_{i}^{k - 1}$ in M_k_-1

A_i=Ø

For $Y_{j}^{k - 1}$ in M_k_-1

If $Y_{i}^{k - 1}$ ∩ $Y_{j}^{k - 1}$ ≠ Ø

A_i← A_i∪ $Y_{j}^{k - 1}$

M_k← M_k∪ {A_i}

End if

End for

End if

If |M_k|=1

返回True

Break

End if

If M_k_-1=M_k(k≥ 1)且 |M_k|≥ 2

返回False

Break

End if

算法2的时间复杂度为O(|X|m+|X|m²), 空间复杂度为O(|X|m), 其中m=|EL(U, U, R)|.

例4 继续以表1的网络形式背景为例进行分析, 基于等势概念的获取全局网络形式概念的详细过程如下.

1)由例1和例2可得表1的L(U, A, I)和L(U, U, R).

2)根据定理3中1)可得

(x₁, a₂a₃a₅)∈ N(U, A, R, I), (x5_,a1_a3_a4_a5₎∈ N(U, A, R, I), (x6, _a1a₂a₄a₅)_∈N(U, A, R, I), (x1x3_,a₂a3₎∈ _N(U, A, R, I), (x1x5, _a3_a5)_∈N₍U, A, R, I), (x1x6, a₂a₅)∈ _N(_U, A, R, I), (x2x6, a1_a2_a4)_∈N₍U_,A, R, I), (x1x3x5, a₃)_∈N₍U, _A, R, I).

对于

(x₂x₄x₅x₆, a₁a₄)∈ L(U, A, I),

因为存在

(x₂x₄x₅x₆, x₂)∈ L(U, U, R),

且

{x₂, x₄, x₅, x₆}∩ {x₂}≠ Ø ,

所以根据定理3中2)可知

(x₂x₄x₅x₆, a₁a₄)∈ N(U, A, R, I).

于是, 可得

$ \begin{aligned} N_{1}(U, A, R, I)= & \left\{\left(x_{1}, a_{2} a_{3} a_{5}\right), \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right), \right. \\ & \left(x_{1} x_{3}, a_{2} a_{3}\right), \left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right), \\ & \left(x_{1} x_{5}, a_{3} a_{5}\right), \left(x_{1} x_{6}, a_{2} a_{5}\right), \\ & \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right), \left(x_{1} x_{3} x_{5}, a_{3}\right), \\ & \left.\left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right)\right\} . \end{aligned} $

3)由1)、2)可得

$ \begin{array}{l} L(U, A, I)-N_{1}(U, A, R, I)-\{(U, \emptyset), (\emptyset, A)\}= \\ \quad\left\{\left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right), \left(x_{4} x_{5} x_{6}, a_{1} a_{4} a_{5}\right), \left(x_{1} x_{4} x_{5} x_{6}, a_{5}\right)\right\} . \end{array} $

对于概念(x₁x₂x₃x₆, a₂), 令

X₁={x₁, x₂, x₃, x₆}.

由例2和引理2知

EL(X₁, X₁, $R_{X_{1}}$ )={(x₂x₆, x₂x₆), (x₁x₃x₆, x₁x₃x₆)},

进而可得

M₀={{x₂, x₆}, {x₁, x₃, x₆}}.

根据定理4可得

M₁={{x₁, x₂, x₃, x₆}},

此时 $|M_{1}|$ =1, 所以

(x₁x₂x₃x₆, a₂)∈ N(U, A, R, I).

类似于上述过程, 对于概念(x₄x₅x₆, a₁a₄a₅), 令

X₂={x₄, x₅, x₆}.

首先, 由例2和引理2可知

EL(X₂, X₂, $R_{X_{2}}$ )={(x₄, x₄), (x₅x₆, x₅x₆)},

于是

M₀={{x₄}, {x₅, x₆}}.

又根据定理4可得

M₁={{x₄}, {x₅, x₆}},

此时M₀=M₁, $|M_{1}|$ ≥ 2, 所以

(x₄x₅x₆, a₁a₄a₅)∉N(U, A, R, I).

同理, 对于概念(x₁x₄x₅x₆, a₅), 可得

(x₁x₄x₅x₆, a₅)∉N(U, A, R, I).

综上所述, 网络形式背景(U, A, R, I)的全局网络形式概念如下:

$ \begin{array}{l} \left(x_{1}, a_{2} a_{3} a_{5}\right), \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right), \left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right), \\ \left(x_{1} x_{3}, a_{2} a_{3}\right), \left(x_{1} x_{5}, a_{3} a_{5}\right), \left(x_{1} x_{6}, a_{2} a_{5}\right), \\ \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right), \left(x_{1} x_{3} x_{5}, a_{3}\right), \left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right), \\ \left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right) . \end{array} $

该结论与例1一致.

3.2 局部网络形式概念的获取方法

根据局部网络形式概念的定义, 基于性质2, 给出局部网络形式概念的一个等价描述.

定理5 设(U, A, R, I)为一个网络形式背景, X⊆U(X≠ Ø )为对象集U的连通子集.若X^*≠ Ø 且

$ \left(X^{* * }-X\right) \cap\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right)=\emptyset, $

则(X, X^*)为局部网络形式概念.

证明由

$ \left(X^{* * }-X\right) \cap\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right)=\emptyset $

可知, ∀ x∈ X^{* *}-X, 都有

$ x \notin\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right), $

所以∀ x_i∈ X, 都有x∉x'_i-X, 即(x, x_i)∉R, 因此x与X中的任意一个对象之间都不存在边, 故X∪ {x}是不连通的.于是, 根据定义7中2)可得, (X, X^*)为局部网络形式概念.

由于全局网络形式概念一定是局部网络形式概念, 并且由局部网络形式概念的定义可知, 获取局部网络形式概念的关键还是在于集合连通性的判别, 于是在定理5的基础上, 给出局部网络形式概念的获取方法.

定理6 设(U, A, R, I)为一个网络形式背景, L(U, U, R)为(U, U, R)的概念集合.对于任意的X⊆U(X≠ Ø 且X^*≠ Ø ), 下列结论成立:

1)若存在(Y, C)∈ L(U, U, R), 有

Y=C, X⊆Y

且

$ \left(X^{* * }-X\right) \cap\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right)=\emptyset \text {, } $

则(X, X^*)为局部网络形式概念;

2)若存在(Y, C)∈ L(U, U, R), 有Y∩ C≠ Ø , X=Y或X=C, 且

$ \left(X^{* * }-X\right) \cap\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right)=\emptyset, $

则(X, X^*)为局部网络形式概念.

证明由定理3和定理5易证.

定理7 设(U, A, R, I)为一个网络形式背景, EL(X, X, R_X)为子背景(X, X, R_X)的等势概念的集合.对∀ X⊆U(X≠ Ø 且X^*≠ Ø ), 记M₀, M₁, …, $M_{|X| - 1}$ 为X的一个子集族序列, 其中

$ \begin{array}{l} M _{0}=\left\{Y_{i}^{0} \mid\left(Y_{i}^{0}, C_{i}^{0}\right) \in E L\left(X, X, R_{X}\right)\right\}, \\ M _{1}=\left\{Y_{i}^{1}=\cup\left\{Y_{j}^{0} \mid Y_{i}^{0} \cap Y_{j}^{0} \neq \emptyset, \forall Y_{j}^{0} \in M _{0}\right\} \mid\right. \\ \left.\quad \forall Y_{i}^{0} \in M _{0}\right\}, \\ \vdots \\ \stackrel{}M_{|X|-1}=\left\{Y_{i}^{|X|-1}=\cup\left\{Y_{j}^{|X|-2} \mid Y_{i}^{|X|-2} \cap Y_{j}^{|X|-2} \neq \emptyset, \right.\right. \\ \left.\left.\quad \forall Y_{j}^{|X|-2} \in M _{|X|-2}\right\} \mid \forall Y_{i}^{|X|-2} \in m_{|X|-2}\right\}, \end{array} $

若存在0≤ k≤ $|X|$ -1, 有 $|M_{k}|$ =1, 且

$ \left(X^{* * }-X\right) \cap\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right)=\emptyset, $

则(X, X^*)为局部网络形式概念.

证明由定理4和定理5易证.

基于定理6和定理7, 下面给出从网络形式背景(U, A, R, I)出发获取局部网络形式概念的步骤.

1)计算L(U, U, R).

2)对于任意的X⊆U(X≠ Ø 且X^*≠ Ø ), 利用定理6判断(X, X^*)是否为局部网络形式概念, 并将由此得到的局部网络形式概念的集合记为 $N_{L}^{1}$ (U, A, R, I).

3)对于其余对象子集X⊆U(X≠ Ø 且X^*≠ Ø ), 首先根据引理2获取子背景(X, X, R_X)的等势概念, 其次计算X的子集族序列

{M_k|0≤ k≤ |X|-1},

最后根据定理7判断(X, X^*)是否为局部网络形式概念.

例5 以表1的网络形式背景为例, 基于等势概念的局部网络形式概念获取过程具体如下.

由定义7可知N(U, A, R, I)⊆N_L(U, A, R, I), 所以由例4可知

$ \begin{array}{l} \left(x_{1}, a_{2} a_{3} a_{5}\right) \in N_{L}(U, A, R, I), \\ \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right) \in N_{L}(U, A, R, I), \\ \left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right) \in N_{L}(U, A, R, I), \\ \left(x_{1} x_{3}, a_{2} a_{3}\right) \in N_{L}(U, A, R, I), \\ \left(x_{1} x_{5}, a_{3} a_{5}\right) \in N_{L}(U, A, R, I), \\ \left(x_{1} x_{6}, a_{2} a_{5}\right) \in N_{L}(U, A, R, I), \\ \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right) \in N_{L}(U, A, R, I), \\ \left(x_{1} x_{3} x_{5}, a_{3}\right) \in N_{L}(U, A, R, I), \\ \left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right) \in N_{L}(U, A, R, I), \\ \left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right) \in N_{L}(U, A, R, I) . \end{array} $

下面考虑其它对象子集.

对于集合X₁={x₃, x₆}, 由例2可知

(x₁x₃x₅x₆, x₁x₃x₅x₆)∈ EL(U, U, R),

于是由引理1可得X₁是连通的, 进一步有

$X_{1}^{*}$ ={a₂}, $X_{1}^{* *}$ ={x₁, x₂, x₃, x₆},

所以

$X_{1}^{* *}$ -X₁={x₁, x₂}.

又因为

$\cup_{x}^{\in}$ x'-X₁={x₁, x₂, x₃, x₅, x₆}-{x₃, x₆}= {x1_,x2_,x5_},

由此可得

$ \left(X_{1}^{* * }-X_{1}\right) \cap\left(\cup_{x \in X_{1}} x^{\prime}-X_{1}\right)=\left\{x_{1}, x_{2}\right\} \neq \varnothing, $

所以根据定理5可得

(x₃x₆, a₂)∉N_L(U, A, R, I).

对于集合X₂={x₁, x₅, x₆}, 由例2可知

(x₁x₃x₅x₆, x₁x₃x₅x₆)∈ EL(U, U, R),

于是由引理1可得, X₂是连通的, 进一步有

$ \begin{array}{l} X_{2}^{* }=\left\{a_{5}\right\}, \\ X_{2}^{* * }=\left\{x_{1}, x_{4}, x_{5}, x_{6}\right\}, \end{array} $

所以

$X_{2}^{* *}$ -X₂={x₄}.

又因为

$ \begin{aligned} \cup_{x_{i} \in X} x_{i}^{\prime}-X= & \left\{x_{1}, x_{2}, x_{3}, x_{5}, x_{6}\right\}-\left\{x_{1}, x_{5}, x_{6}\right\}= \\ & \left\{x_{2}, x_{3}\right\}, \end{aligned} $

由此可得

$ \left(X_{2}^{* * }-X_{2}\right) \cap\left(\cup_{x \in X_{2}} x^{\prime}-X_{2}\right)=\emptyset, $

所以根据定理5可得

(x₁x₅x₆, a₅)∈ N_L(U, A, R, I).

同理可得

(x₄, a₁a₄a₅)∈ N_L(U, A, R, I), (x5_x6_,a1_a4_a5₎∈ NL₍U, A, R, I).

综上所述, 网络形式背景(U, A, R, I)的局部网络形式概念如下:

该结论与例1一致.

4 实验及结果分析

本文算法1的作用仅是从理论角度丰富连通集的获取方法, 故本节对算法2进行评估.

实验选取如下8个数据集评估算法性能.

1)6个UCI数据库上的真实数据集:Cervical Cancer Behavior Risk(CCBR)、Higher Education Stu- dents Performance Evaluation(HESPE)、Connectionist Bench(CB)、 Musk(Version 1)、Breast Cancer Wiscon- sin(BCW)、Mice Protein Expression(MPE)数据集.

2)2 个随机生成的数据集:RGD1、RGD2数据集.

具体数据集信息如表3所示, 表中|U|表示对象个数, |A|表示属性个数.

表3 实验数据集及参数 Table 3 Experimental datasets and parameters

名称	$\|U\|$	$\|A\|$	形式背景 (U, U, R)的规模	形式背景 (U, A, I)的规模
CCBR	72	19	72× 72	72× 19
HESPE	145	31	145× 145	145× 31
CB	208	60	208× 208	208× 60
Musk	476	166	476× 476	476× 166
BCW	569	30	569× 569	569× 30
RGD1	750	60	750× 750	750× 60
MPE	1080	26	1080× 1080	1080× 26
RGD2	1500	90	1500× 1500	1500× 90

表3 实验数据集及参数 Table 3 Experimental datasets and parameters

为了验证算法2的有效性, 使用算法2计算全局网络形式概念和局部网络形式概念, 并与文献[17]中的算法1和算法2分别进行对比.

实验1为全局网络形式概念的对比实验, 实验2为局部网络形式概念的对比实验.由于在实验1中两种算法均涉及计算形式背景(U, A, I)的概念, 故此过程耗时不予考虑, 重点分析概念外延的连通性判定耗时.

此外, 为了确保算法验证的严谨性, 实验中对所有的全局网络形式概念进行完整枚举, 以验证算法结果的正确性.

在计算全局网络形式概念和局部网络形式概念的过程中, 关于集合连通性判定过程是相同的.在评估算法的有效性时, 计算单个结果与计算所有结果并无本质区别, 其正确性由算法逻辑的一致性保证, 而效率差异仅反映问题规模的变化.因此, 实验2中只对比计算一个对象子集生成局部网络概念的耗时.

为了减少实验过程中的偶然误差, 两种算法均进行5次实验, 并取平均值作为最终的运行时间, 以此提升时间对比结果的准确性和可靠性.

在8个数据集上, 利用两种算法得到所有全局网络形式概念的耗时及概念个数的结果如表4所示.由表可见, 两种算法的全局网络形式概念计算结果一致, 由此验证本文算法2的正确性.此外, 表4表明本文算法2在不同数据集上计算全局网络概念的运行时间均低于对比算法, 在个别数据集上还有显著优势.

表4 两种算法计算全局网络形式概念的耗时与概念个数对比 Table 4 Comparison of runtime and the number of concepts between 2 algorithms for computing global network formal concepts

两种算法分别计算局部网络形式概念的耗时如表5所示.由表可见, 本文算法2在大多数数据集上计算局部网络形式概念的运行时间低于对比算法.由于数据集规模由小到大排列, 从而由表5可得出:随着数据集规模的逐渐增大, 算法2的运行时间的增加幅度相对平缓, 这表明其在较大规模数据集上具有一定的适用性.

表5 两种算法计算局部网络形式概念的耗时对比 Table 5 Runtime comparison between 2 algorithms for computing local network formal concepts s

5 结束语

本文利用网络形式背景(U, A, R, I)既包含对象与属性之间的信息(U, A, I), 也包含对象与对象之间的信息(U, U, R)的特点, 并借助(U, U, R)的等势概念, 提出两类网络形式概念的获取方法.首先, 从(U, U, R)的等势概念得到U的所有连通子集的获取方法, 并通过概念诱导算子分析连通集的性质.然后, 针对全局网络形式概念, 通过(U, U, R)的等势概念与其子背景等势概念的联系, 给出判别(U, A, I)中任意概念是全局网络形式概念的方法, 并进一步得到获取所有局部网络形式概念的方法.最后通过实验说明本文两类网络形式概念获取方法的有效性.

由于现实生活中的数据动态变化, 因此在上述研究的基础上, 还可进一步探讨当网络形式背景动态变化时两类网络形式概念的更新规律.后续研究还可考虑使用更高效的幂集计算算法优化算法1, 使用高效的极大元查找算法优化算法2 .此外, 今后可进一步考虑将连通性引入三元概念分析中, 研究网络三元背景的知识获取等问题.

本文责任编委张燕平

Recommended by Associate Editor ZHANG Yanping

参考文献

文献选项

[1]	WILLE R. Restructuring Lattice Theory: An Approach Based on Hierarchies of Concept // REIDEL D, ed. Ordered Sets. Berlin, Germany: Springer, 1982: 445-470. [本文引用:3]
[2]	GANTER B, WILLE R. Formal Concept Analysis: Mathematical Foun-dations. Berlin, Germany: Springer, 1999. [本文引用:3]
[3]	FRAWLEY W J, PIATETSKY-SHAPIRO G, MATHEUS C J. Know-ledge Discovery in Databases: An Overview. AI Magazine, 1992, 13(3): 57-70. [本文引用:1]
[4]	智慧来, 李金海. 基于必然属性分析的粒描述. 计算机学报, 2018, 41(12): 2702-2719. (ZHI H L, LI J H. Granule Description Based on Necessary Attri-bute Analysis. Chinese Journal of Computers, 2018, 41(12): 2702-2719. ) [本文引用:1]
[5]	胡可云, 陆玉昌, 石纯一. 基于概念格的分类和关联规则的集成挖掘方法. 软件学报, 2000, 11(11): 1478-1484. (HU K Y, LU Y C, SHI C Y. An Integrated Mining Approach for Classification and Association Rule Based on Concept Lattice. Journal of Software, 2000, 11(11): 1478-1484. ) [本文引用:1]
[6]	ZHANG Q, SHI C Y, NIU Z D, et al. HCBC: A Hierarchical Case-Based Classifier Integrated with Conceptual Clustering. IEEE Transactions on Knowledge and Data Engineering, 2019, 31(1): 152-165. [本文引用:1]
[7]	KAYTOUE M, KUZNETSOV S O, NAPOLI A, et al. Mining Gene Expression Data with Pattern Structures in Formal Concept Analysis. Information Sciences, 2011, 181(10): 1989-2001. [本文引用:1]
[8]	TONELLA P. Using A Concept Lattice of Decomposition Slices for Program Understand ing and Impact Analysis. IEEE Transactions on Software Engineering, 2003, 29(6): 495-509. [本文引用:1]
[9]	ZHANG W X, WEI L, QI J J. Attribute Reduction Theory and Approach to Concept Lattice. Science in China Series F: Information Sciences, 2005, 48(6): 713-726. [本文引用:1]
[10]	魏玲, 曹丽, 祁建军, 等. 形式概念分析中的概念约简与概念特征. 中国科学: 信息科学, 2020, 50(12): 1817-1833. (WEI L, CAO L, QI J J, et al. Concept Reduction and Concept Characteristics in Formal Concept Analysis. SCIENTIA SINICA(Informationis), 2020, 50(12): 1817-1833. ) [本文引用:1]
[11]	PANG J Z, ZHANG B, CHEN M H. A Novel L-Fuzzy Concept Learning via Two-Way Concept-Cognitive Learning and Residuated Implication. International Journal of Fuzzy Systems, 2024, 26(8): 2783-2804. [本文引用:1]
[12]	李金海, 米允龙, 刘文奇. 概念的渐进式认知理论与方法. 计算机学报, 2019, 42(10): 2233-2250. (LI J H, MI Y L, LIU W Q. Incremental Cognition of Concepts: Theories and Methods. Chinese Journal of Computers, 2019, 42(10): 2233-2250. ) [本文引用:1]
[13]	徐伟华, 李金海, 折延宏. 概念认知学习理论与方法. 北京: 科学出版社, 2023. (XU W H, LI J H, ZHE Y H. Concept-Cognitive Learning: Theories and Methods. Beijing, China: Science Press, 2023. ) [本文引用:1]
[14]	刘文星, 范敏, 李金海. 网络形式背景下的社区划分方法研究. 计算机科学与探索, 2021, 15(8): 1441-1449. (LIU W X, FAN M, LI J H. Research on Community Division Method under Network Formal Context. Journal of Frontiers of Computer Science and Technology, 2021, 15(8): 1441-1449. ) [本文引用:1]
[15]	FAN M, LUO S, LI J H. Network Rule Extraction under the Network Formal Context Based on Three-Way Decision. Applied Inte-lligence, 2023, 53(5): 5126-5145. [本文引用:1]
[16]	范敏, 郭瑞欣, 李金海. 网络决策形式背景下基于因果力的邻域推荐算法. 模式识别与人工智能, 2022, 35(11): 977-988. (FAN M, GUO R X, LI J H. Neighborhood Recommendation Al-gorithm Based on Causality Force under Network Formal Decision Con-text. Pattern Recognition and Artificial Intelligence, 2022, 35(11): 977-988. ) [本文引用:1]
[17]	闫梦宇, 李金海, 刘文奇, 等. 带对象结构信息形式背景的概念知识发现与演化. 电子学报, 2023, 51(1): 11-17. (YAN M Y, LI J H, LIU W Q, et al. Conceptual Knowledge Discovery and Evolution in Formal Context with Object Structure Information. Acta Electronica Sinica, 2023, 51(1): 11-17. ) [本文引用:6]
[18]	YAN M Y, LI J H. Knowledge Discovery and Updating under the Evolution of Network Formal Contexts Based on Three-Way Decision. Information Sciences, 2022, 601: 18-38. [本文引用:1]
[19]	HAO F, YAU S S, MIN G Y, et al. Detecting k-Balanced Trusted Cliques in Signed Social Networks. IEEE Internet Computing, 2014, 18(2): 24-31. [本文引用:2]
[20]	HAO F, MIN G Y, PEI Z, et al. K-Clique Community Detection in Social Networks Based on Formal Concept Analysis. IEEE Systems Journal, 2017, 11(1): 250-259. [本文引用:3]
[21]	HAO F, PEI Z, YANG L T. Diversified Top- k Maximal Clique Detection in Social Internet of Things. Future Generation Computer Systems, 2020, 107: 408-417. [本文引用:2]
[22]	卢开澄, 卢华明. 图论及其应用. 北京: 清华大学出版社, 1995. (LU K C, LU H M. Graph Theory and Its Application. Beijing, China: Tsinghua University Press, 1995. ) [本文引用:1]

1982

0.0

... 形式概念分析(Formal Concept Analysis,FCA)^[1,2]作为知识表示和数据分析的有效工具,由Wille为重建格理论而提出 ...

... 1 形式概念分析定义1^[1,2] 称(U,A,I)为一个形式背景,其中: ...

... 定义3^[1,2] 设(U,A,I)为一个形式背景,H⊆U,N⊆A ...

1999

0.0

... 形式概念分析(Formal Concept Analysis,FCA)^[1,2]作为知识表示和数据分析的有效工具,由Wille为重建格理论而提出 ...

... 1 形式概念分析定义1^[1,2] 称(U,A,I)为一个形式背景,其中: ...

... 定义3^[1,2] 设(U,A,I)为一个形式背景,H⊆U,N⊆A ...

1992

0.0