
万 青,博士,副教授,主要研究方向为粗糙集、形式概念分析、粒计算等.E-mail:wqysbe@163.com.
作者简介:

艾森森,硕士研究生,主要研究形式概念分析.E-mail:sensenai@126.com.

李金海,博士,教授,主要研究方向为认知计算、粒计算、大数据分析、概念格、粗糙集等.E-mail:jhlixjtu@163.com.
第二十七届中国科协年会学术论文
在图网络数据诱导的网络形式背景中,基于形式概念与半概念,引入集合连通性,得到全局网络形式概念与局部网络形式概念,而集合连通性与形式背景的等势概念之间具有密切关系,这两类网络形式概念与等势概念之间也必然存在关联性.因此,在网络形式背景中,文中首先借助等势概念,提出获取对象集的所有连通子集的方法,并通过概念诱导算子刻画连通集的性质.然后,提出由原形式背景等势概念获取子背景等势概念的方法,进而得到由子背景的等势概念获取全局网络形式概念和局部网络形式概念的方法.最后,通过数值实验表明文中两类网络形式概念获取方法的有效性和可行性.
WAN Qing, Ph.D., associate professor. Her research interests include rough set theory, formal concept analysis and granular computing.
About Author:
AI Sensen, Master student. His research interests include formal concept analysis.
LI Jinhai, Ph.D., professor. His research interests include cognitive computing, granular computing, big data analysis, concept la⁃ttice and rough sets.
Academic Papers of the 27th Annual Meeting of the China Association for Science and Technology
In the network formal context induced by graph network data, global network formal concepts and local network formal concepts are obtained by introducing the set connectivity on the basis of formal concepts and semiconcepts respectively, and there is a close relationship between the set connectivity and the equiconcepts of the formal context. Therefore, there must be a correlation between the two types of network formal concepts and equiconcepts. In this paper, for network formal contexts, a method for obtaining all connected subsets of the object set is first proposed by means of the equiconcepts,and some properties of the connected sets are characterized through concept-induced operators. Next, a method is presented for deriving the equiconcepts of the subcontext from the equiconcepts of the original formal context. Subsequently, the methods for acquiring global network formal concepts and local network formal concepts are obtained from the equiconcepts of the subcontext. Finally, numerical experiments illustrate the effectiveness and feasibility of the proposed acquisition methods for the two types of network formal concepts.
形式概念分析(Formal Concept Analysis, FCA)[1, 2]作为知识表示和数据分析的有效工具, 由Wille为重建格理论而提出.FCA的数据表示为一个二维交叉表, 称为形式背景.形式背景由对象集、属性集及两者之间的二元关系构成, 记为(U, A, I).在形式背景中定义概念诱导算子及概念之间的偏序关系, 可得到一个完备格, 称为概念格, 记为L(U, A, I), 体现概念之间的层级关系.FCA自提出之后, 一直备受学者关注, 现已应用于知识发现[3, 4]、机器学习[5, 6]、数据挖掘[7]、软件工程[8]、特征选择[9, 10]及概念认知[11, 12]等领域.
随着科技的快速发展, 产生的数据越来越多, 包含的信息也越来越复杂.例如:图网络数据不仅包含对象-属性信息, 还包含对象-对象信息.相比FCA中的形式背景, 此类数据可看作是在形式背景的基础上增加对象与对象之间的信息, 故将此类数据称为网络形式背景, 记为(U, A, M, I), 其中M表示对象与对象之间的信息.这种数据表示方式有助于将复杂网络分析和FCA有效结合, 从概念认知的角度[13]挖掘网络数据中更多隐藏的知识和规律.刘文星等[14]在网络形式背景中结合网络结构与节点属性方式信息, 给出网络节点中心度和中心势的定义, 并结合网络结构和属性信息, 提出网络社区划分方法.Fan等[15]将复杂网络分析与三支决策统一在一个框架下, 提出三支决策的网络形式背景, 并研究基于置信度的双向规则提取算法和约简算法.范敏等[16]在网络形式背景中, 通过变精度弱概念集, 提出基于因果力的邻域推荐算法.闫梦宇等[17]和Yan等[18]基于网络形式背景, 在概念(三支概念)的基础上引入集合的连通性, 提出全局网络形式概念(全局网络OE-概念)和局部网络形式概念(局部网络OE-概念)的定义, 并在此基础上利用这类特殊的概念研究网络节点的分类问题.需要强调的是, 在网络形式背景(U, A, M, I)中提出的这类网络形式概念, 是在形式背景(U, A, I)中概念和半概念的基础上增加对象子集是连通集这一条件, 而这一条件的判定依赖于对象与对象之间的信息M.
社会网络是由个体组成的点状网络拓扑结构, 个体与个体之间存在各种相互依赖的社会关系, 在拓扑网络中用边表示这种关系, 因此社会网络通常可表示为一个图, 该图的顶点集是个体的集合, 边集是个体与个体之间的关系.Hao等[19]将FCA引入社会网络分析中, 将图转化为由顶点与顶点构成的形式背景(U, U, R), 利用该形式背景中的特殊概念— — 等势概念检测符号社交网络中k-平衡可信派系.之后, Hao等[20]将FCA引入k-派系检测问题中, 证明k-等势概念和k-派系之间一一对应, 并利用k-等势概念和k-内涵概念, 提出k-派系和k-派系社团的检测方法.此外, Hao等[21]还利用等势概念和极大派系之间的特殊关系, 提出基于FCA的社会网络多元化top-k极大社团的挖掘算法.需要特别说明的是, 上述文献中提到的派系均是完全连通图, 即从节点和节点构成的形式背景中得到的等势概念可用于获取完全连通图.
事实上, 网络形式背景(U, A, M, I)中对象与对象之间的信息M就是社会网络分析中顶点与顶点构成的形式背景(U, U, R)中的二元关系R.因此, 基于网络形式背景的这一特点, 本文在文献[17]和文献[20]的基础上, 借助(U, U, R)中的等势概念, 先提出对象子集是否为连通集的判别方法, 再提出全局网络形式概念和局部网络形式概念的获取方法.
定义1[1, 2] 称(U, A, I)为一个形式背景, 其中:
$ U=\left\{x_{1}, x_{2}, \cdots, x_{n}\right\}$
为对象集, 每个xi(i≤ n)表示一个对象;
$ A=\left\{a_{1}, a_{2}, \cdots, a_{m}\right\}$
为属性集, 每个aj(j≤ m)表示一个属性; I为U和A之间的二元关系, I⊆U× A.若(x, a)∈ I, 则表示对象x具有属性a, 记为xIa; 若(x, a)∉I, 则表示对象x不具有属性a.
设(U, A, I)为一个形式背景, 在对象子集X⊆U和属性子集B⊆A上分别定义概念诱导算子* 如下:
$ \begin{array}{l} X^{* }=\{a \mid a \in A, \forall x \in X, (x, a) \in I\}, \\ B^{* }=\{x \mid x \in U, \forall a \in B, (x, a) \in I\}, \end{array}$
其中, X* 表示集合X中所有对象共同具有的属性集合, B* 表示共同具有集合B中所有属性的对象集合.
设(U, A, I)为一个形式背景, X⊆U, B⊆A.如果二元组(X, B)满足X* =B, X=B* , 则称(X, B)为一个形式概念, 简称概念, 其中, X表示概念的外延, B表示概念的内涵.记L(U, A, I)为形式背景(U, A, I)中所有概念的集合.
定义2[19] 设(U, A, I)为一个形式背景, X⊆U, B⊆A.如果二元组(X, B)满足X* =B, X=B* 且X=B, 则称(X, B)为一个等势概念, 其中, X表示等势概念的外延, B表示等势概念的内涵.记EL(U, A, I)为形式背景(U, A, I)中所有等势概念的集合.
定义3[1, 2] 设(U, A, I)为一个形式背景, H⊆U, N⊆A.记
$ I_{H \times N}=I \cap(H \times N) \text {, }$
称(H, N, IH× N)为(U, A, I)的子背景.
在子背景(H, N, IH× N)中, ∀ Y⊆H, C⊆N, 将概念诱导算子* 记为Y* N, C* H.事实上, 由* 算子的定义可知
Y* N=Y* ∩ N, C* H=C* ∩ H.
图通常表示为一个二元对G=(V, E), 其中, V表示图G中顶点的集合, E表示图G中边的集合.对于图G的两个顶点vi∈ V, vj∈ V, 若vi、vj之间存在一条边, 则表示为< vi, vj> ∈ E.对于图G的任意非空顶点子集V1⊂V, 称以V1为顶点集, 以G中两个端点都在V1中、边为其边集的图为V1的导出子图, 记为G[V1].
定义4[22] 设G=(V, E)为一个图, 称图G为连通的当且仅当对于图G的任意两个顶点vi∈ V, vj∈ V, 从顶点vi出发, 经过若干个中间顶点, 能到达顶点vj.特别地, 若对于任意的xi∈ V, xj∈ V, 都有< xi, xj> ∈ E, 则称图G为完全连通图.
网络是由节点和连接这些节点的线组成的系统, 这些节点表示顶点, 线表示边, 通常表示为图G=(V, E).对于一个简单无向图G, 定义修正邻接矩阵M=(mij)如下[20]:
$ m_{i j}=\left\{\begin{array}{ll} 1, & \left\langle v_{i}, v_{j}\right\rangle \in E, i \neq j \text { 或 } v_{i}=v_{j} \\ 0, & \text { 其它 } \end{array}\right.$
结合形式背景(U, A, I)和以对象集U为顶点集的图G=(U, E)的修正邻接矩阵, 所得的表格称为网络形式背景(也称为带对象结构信息形式背景).在网络形式背景中不仅包含对象与对象之间的信息, 同时也包含对象与属性之间的信息, 其详细定义
如下所示.
定义5[17] 称四元组(U, A, M, I)为一个网络形式背景, 其中
U={x1, x2, …, xn}
为对象集,
A= {a1, a2, …, am}
为属性集, M=(mij)为对象集U上的结构矩阵(即对象集对应的修正邻接矩阵); I为U和A之间的二元关系, 若(x, a)∈ I, 则表示对象x具有属性a, 记为xIa; 若(x, a)∉I, 则表示对象x不具有属性a.
定义6[17] 设(U, A, M, I)为一个网络形式背景, X⊆U, X≠ Ø .若由集合X在结构矩阵M中诱导的子图G[X]是连通的, 则称X是连通的, 此时也称X为对象集U的连通子集.
在定义6中, 若X的导出子图G[X]是完全连通的, 则称X为U的完全连通子集.进一步地, 若不存在对象集U的完全连通子集Y, 使得X⊂Y, 此时称X为对象集U的极大完全连通子集.特别地, 单点集和二元连通子集都是U的完全连通子集.
定义7[17] 设(U, A, M, I)为一个网络形式背景, X⊆U, B⊆A(X≠ Ø 且B≠ Ø ).
1)若X* =B, X=B* 且X是连通的, 则称(X, B)为全局网络形式概念.记N(U, A, M, I)为(U, A, M, I)的所有全局网络形式概念的集合.
2)若X* =B, X为连通的且不存在x∈ B* -X使得X∪ {x}连通, 则称(X, B)为局部网络形式概念.记NL(U, A, M, I)为(U, A, M, I)的所有局部网络形式概念的集合.
由定义7可知, 若(X, B)为(U, A, M, I)的全局网络形式概念, 则(X, B)一定为(U, A, I)的概念, 也一定为(U, A, M, I)的局部网络形式概念, 即
N(U, A, M, I)⊆L(U, A, I), N(U, A, M, I)⊆NL(U, A, M, I).
例1 图1为一个学术网络图, 每个顶点表示一个对象, 顶点旁边为该对象具有的属性信息, 边表示学者之间存在学术交流关系.
表1为图1对应的网络形式背景(U, A, M, I), 对象集
U={x1, x2, x3, x4, x5, x6},
| 表1 网络形式背景(U, A, M, I) Table 1 Network formal context(U, A, M, I) |
属性集
A={a1, a2, a3, a4, a5}.
在表1中, 形式背景(U, A, I)概念的集合为:
$ \begin{aligned} L(U, A, I)= & \left\{(\emptyset, A), \left(x_{1}, a_{2} a_{3} a_{5}\right), \left(x_{4} x_{5} x_{6}, a_{1} a_{4} a_{5}\right), \right. \\ & \left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right), \left(x_{1} x_{3}, a_{2} a_{3}\right), \\ & \left(x_{1} x_{5}, a_{3} a_{5}\right), \left(x_{1} x_{6}, a_{2} a_{5}\right), \\ & \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right), \left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right), \\ & \left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right), \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right), \\ & \left.\left(x_{1} x_{3} x_{5}, a_{3}\right), \left(x_{1} x_{4} x_{5} x_{6}, a_{5}\right), (U, \emptyset)\right\} . \end{aligned}$
全局网络形式概念的集合为:
$ \begin{aligned} N(U, A, M, I)= & \left\{\left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right), \left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right), \right. \\ & \left(x_{1}, a_{2} a_{3} a_{5}\right), \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right), \\ & \left(x_{1} x_{3}, a_{2} a_{3}\right), \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right), \\ & \left(x_{1} x_{5}, a_{3} a_{5}\right), \left(x_{1} x_{6}, a_{2} a_{5}\right), \\ & \left.\left(x_{1} x_{3} x_{5}, a_{3}\right), \left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right)\right\} . \end{aligned}$
局部网络形式概念的集合为:
$ \begin{array}{l} N_{L}(U, A, M, I)=N(U, A, M, I) \cup \\ \quad\left\{\left(x_{5} x_{6}, a_{1} a_{4} a_{5}\right), \left(x_{4}, a_{1} a_{4} a_{5}\right), \left(x_{1} x_{5} x_{6}, a_{5}\right)\right\} . \end{array}$
本文将对象集U上的结构矩阵M称为对象集U的形式背景, 记为(U, U, R), 即∀ xi∈ U, xj∈ U, 若mij=1, 则(xi, xj)∈ R; 若mij=0, 则(xi, xj)∉R.
因此, 网络形式背景(U, A, M, I)可看作是由形式背景(U, U, R)和(U, A, I)合并而成的数据集, 于是本文将网络形式背景记为(U, A, R, I).为了不引起混淆, 在形式背景(U, A, I)上用符号* 表示概念诱导算子, 在形式背景(U, U, R)上用符号'表示概念诱导算子.∀ X⊆U, X'表示与X中所有对象都有边连接的对象的集合.特别地, 记{x}'为x', x'表示与x有边连接的所有对象的集合.
在网络形式背景(U, A, R, I)中, 可由概念诱导算子'得到的等势概念获取U的所有完全连通子集.
引理1[21] 设(U, A, R, I)为一个网络形式背景, EL(U, U, R)为(U, U, R)的等势概念集合, 则对象集U的所有极大完全连通子集为
{Y|(Y, C)∈ EL(U, U, R)}.
进一步地, 对象集U的所有完全连通子集为
{X|X⊆Y, (Y, C)∈ EL(U, U, R)}.
下面通过概念诱导算子'给出完全连通子集的性质.
性质1 设(U, A, R, I)为一个网络形式背景, X⊆U(X≠ Ø )为对象集U的完全连通子集.∀ x∈ U-X, 若x∈ X', 则X∪ {x}为对象集U的完全连通子集.
证明 ∀ x∈ U-X, 若x∈ X', 则由'算子的定义可得, ∀ y∈ X, 都有(x, y)∈ R, 所以x、y之间存在一条边, 由y的任意性知, x与X中的每个对象之间都存在一条边.又因为X为对象集U的完全连通子集, 所以∀ xi∈ X∪ {x}, xj∈ X∪ {x}, xi、xj之间都存在一条边.于是, 由完全连通集的定义可证明X∪ {x}为对象集U的完全连通子集.
在图论中, 由于一个连通集(连通图)可表示为它的两个交非空的连通子集(连通子图)的并, 即若X⊆U为连通子集当且仅当存在U的两个连通子集X1、X2, 满足X1∩ X2≠ Ø 且X1∪ X2=X.此特点称为连通图的分解性.因此, 在引理1的基础上, 下面给出由等势概念获取对象集U的所有连通子集的方法.
定理1 设(U, A, R, I)为一个网络形式背景, EL(U, U, R)为(U, U, R)的等势概念的集合, F0, F1, …,
$ \begin{array}{c} \mathcal{J}_{0}=\left\{Y_{i}^{0}\left|Y_{i}^{0} \subseteq Y, (Y, C) \in E L(U, U, R), \left|Y_{i}^{0}\right| \geqslant 2\right\}, \right. \\ \mathcal{J}_{1}=\left\{Y_{i}^{0} \cup Y_{j}^{0} \mid Y_{i}^{0} \cap Y_{j}^{0} \neq \emptyset \text { 且 } Y_{i}^{0} \in \mathcal{J}_{0}, Y_{j}^{0} \in \mathcal{J}_{0}\right\}, \\ \vdots \\ \mathcal{J}_{|U|-1}=\left\{Y_{i}^{|U|-2} \cup Y_{j}^{|U|-2} \mid Y_{i}^{|U|-2} \cap Y_{j}^{|U|-2} \neq \emptyset\right. \text { 且 } \\ Y_{i}^{\left.|U|^{-2} \in \mathcal{J}_{|U|-2}, Y_{j}^{|U|^{-2}} \in \mathcal{J}_{|U|-2}\right\} .} \end{array}$
若存在一个r∈ {1, 2, …,
Fr-Fr-1=Ø ,
则对象集U的所有连通子集的集合为:
$ \Phi=\left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\bigcup_{i=0}^{r-1} \mathcal{F}_{i}\right), $
证明 由引理1和连通图的分解性可知
$ \left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\cup_{i=0}^{r-1} \mathcal{F}_{i}\right) \subseteq \Phi .$
因此, 下面仅需证明
$ \Phi \subseteq\left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\bigcup_{i=0}^{r-1} \mathcal{F}_{i}\right) .$
∀ X∈ Φ , 当|X|=1时,
X∈ {{xi}|xi∈ U},
故X一定属于
$ \left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\cup_{i=0}^{r-1} \mathcal{F}_{i}\right) .$
当|X|≥ 2时, 由引理1可计算X的所有极大完全连通子集, 不妨设为
Ψ 0={X1, X2, …, Xk},
则∀ Xi∈ Ψ 0, Xi为U的完全连通子集, 所以Xi∈ F0.若|Ψ 0|=1, 显然有
Ψ 0={X}⊆F0.
否则, 对于任意给定的Xi∈ Ψ 0, 假设∀ xi∈ Xi, xj∈ X-Xi, 有(xi, xj)∉R, 则由xi、xj的任意性可知, xi不能经过若干顶点到达xj, 这与X是连通的存在矛盾.因此, 存在xi∈ Xi, xj∈ X-Xi, 有(xi, xj)∈ R, 显然{xi, xj}为X的完全连通子集, 则存在Xj∈ Ψ 0, 使得{xi, xj}⊆Xj且Xi≠ Xj.进而, 对于任意给定的Xi∈ Ψ 0, 存在Xj∈ Ψ 0-{Xi}, 有
Xi∩ Xj={xi},
则
Xi∪ Xj∈ F1.
记
Ψ 1={Xi∪ Xj|Xi∩ Xj≠ Ø , ∀ Xi∈ Ψ 0, Xj∈ Ψ 0},
显然有Ψ 1⊆F1.
下面考虑集合Ψ 1.若|Ψ 1|=1, 则显然有
Ψ 1={X}⊆F1.
否则, 对于任意给定的Yi∈ Ψ 1, 假设∀ yi∈ Y, ∀ yj∈ X-Yi, 都有(yi, yj)∉R, 则由yi、yj的任意性可知, yi不能经过若干顶点到达yj, 这与X是连通的存在矛盾.因此, 存在yi∈ Yi, yj∈ X-Yi, 使得(yi, yj)∈ R, 所以存在Yj∈ Ψ 1-{Yi}, 使得{yi, yj}⊆Yj.进一步可知, 对于任意给定的Yi∈ Ψ 1, 一定存在Yj∈ Ψ 1-{Yi}, 有
Yi∩ Yj={yi},
则
Yi∪ Yj∈ F2.
记
Ψ 2={Yi∪ Yj|Yi∩ Yj≠ Ø , ∀ Yi∈ Ψ 1, Yj∈ Ψ 1}.
下面考虑集合Ψ 2.以此类推, 由X⊆U可知, 存在0≤ p≤ r, 使得|Ψ p|=1, 即
Ψ p={X}⊆Fp.
综上所述, ∀ X∈ Φ , 都有
$ X \in\left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\bigcup_{i=0}^{r-1} \mathcal{F}_{i}\right), $
所以
$ \Phi \subseteq\left\{\left\{x_{i}\right\} \mid x_{i} \in U\right\} \cup\left(\bigcup_{i=0}^{r-1} \mathcal{F}_{i}\right) .$
基于定理1, 获取对象集U的连通子集的方法步骤如算法1所示.
算法1 对象集U的连通子集的获取方法
输入 EL(U, U, R)
输出 对象集U的连通子集的集合Φ
初始化 Φ =Ø
F0={
k=1∶ |U|-1, Fk=Ø
For
For
If
Fk← Fk∪ {
Φ ← Φ ∪ Fk
End if
End for
End for
If Fk-Fk-1=Ø
输出 Φ
End if
算法1的时间复杂度为O(mn2n+n2k2), 空间复杂度为O(mn2n+tnk2), 其中, m=|EL(U, U, R)|, n为等势概念外延集的平均大小, t为迭代次数, k=max Fk. 需说明的是, 算法1得到的Φ 不包含单点集.
定理1的特点是借助FCA给出对象集的所有连通子集的获取方法, 但该方法与图论中常见方法— — 深度优先搜索和广度优先搜索的时间复杂度是同一级别的.
下面以表1所示的网络形式背景为例, 解释对象集U的连通子集的获取方法.
例2 在表1中, 通过概念诱导算子可得形式背景(U, U, R)的概念集合:
$ \begin{aligned} L(U, U, R)= & \left\{(\emptyset, U), \left(x_{2}, x_{2} x_{4} x_{5} x_{6}\right), \left(x_{2} x_{4}, x_{2} x_{4}\right), \right. \\ & \left(x_{5} x_{6}, x_{1} x_{2} x_{3} x_{5} x_{6}\right), \left(x_{1} x_{2} x_{3} x_{5} x_{6}, x_{5} x_{6}\right), \\ & \left(x_{1} x_{3} x_{5} x_{6}, x_{1} x_{3} x_{5} x_{6}\right), \left(x_{2} x_{4} x_{5} x_{6}, x_{2}\right), \\ & \left.\left(x_{2} x_{5} x_{6}, x_{2} x_{5} x_{6}\right), (U, \emptyset)\right\} . \end{aligned}$
进一步可得形式背景(U, U, R)的等势概念集合:
$ E L(U, U, R)=\left\{\left(x_{2} x_{5} x_{6}, x_{2} x_{5} x_{6}\right), \left(x_{1} x_{3} x_{5} x_{6}, x_{1} x_{3} x_{5} x_{6}\right), \left(x_{2} x_{4}, x_{2} x_{4}\right)\right\} .$
根据EL(U, U, R), 先计算F0,
F0={x1, x3}, {x1, x5}, {x1, x6}, {x2, x4}, {x2, x5},
{x2, x6}, {x3, x5}, {x3, x6}, {x5, x6}, {x1, x3, x5},
{x1, x3, x6}, {x2, x5, x6}, {x3, x5, x6}, {x1, x5, x6},
{x1, x3, x5, x6}.
基于F0, 计算F1,
F1={x1, x2, x5}, {x1, x2, x6}, {x1, x3, x5}, {x1, x2, x3, x5},
{x1, x3, x6}, {x1, x5, x6}, {x2, x3, x5}, {x1, x2, x3, x6},
{x2, x3, x6}, {x2, x4, x5}, {x2, x4, x6}, {x1, x2, x5, x6},
{x2, x5, x6}, {x3, x5, x6}, {x1, x2, x3, x5, x6},
{x1, x3, x5, x6}, {x2, x3, x5, x6}, {x2, x4, x5, x6}.
因为F1-F0≠ Ø , 所以继续计算F2,
F2={x1, x2, x3, x5}, {x1, x2, x3, x6}, {x1, x2, x3, x4, x5},
{x1, x2, x4, x5}, {x1, x2, x4, x6}, {x1, x2, x3, x4, x6},
{x1, x2, x5, x6}, {x1, x3, x5, x6}, {x1, x2, x3, x5, x6},
{x2, x3, x4, x5}, {x2, x3, x4, x6}, {x1, x2, x4, x5, x6},
{x2, x3, x5, x6}, {x2, x4, x5, x6}, {x2, x3, x4, x5, x6},
{x1, x2, x3, x4, x5, x6}.
又因为F2-F1≠ Ø , 于是继续计算F3,
F3={x1, x2, x3, x4, x5}, {x1, x2, x3, x4, x6},
{x1, x2, x3, x5, x6}, {x1, x2, x4, x5, x6},
{x2, x3, x4, x5, x6}, {x1, x2, x3, x4, x5, x6}.
因为F3-F2=Ø , 故根据定理1可得对象集U的所有连通子集的集合:
Φ ={{xi}|xi∈ U}∪ F0∪ F1∪ F2.
下面给出直接通过概念诱导算子'获取连通子集的方法.
定理2 设(U, A, R, I)为一个网络形式背景, x∈ U, y∈ U, 则有
1)x'为对象集U的连通子集;
2)若x'∩ y'≠ Ø , 则x'∪ y'为对象集U的连通子集.
证明 先证1).∀ xi∈ x', xj∈ x', 由'算子的定义可知, (xi, x)∈ R且(xj, x)∈ R, 进而可得xi、x之间存在一条边, xj、x之间存在一条边, 因此xi可经过x到达xj, 由xi、xj的任意性可知, x'为U的连通子集.
再证2).根据连通图的分解性及1)中结论可证.
类似于性质1, 通过概念诱导算子'可得到连通子集的性质.
性质2 设(U, A, R, I)为一个网络形式背景, X⊆U(X≠ Ø )为对象集U的连通子集,
∀ x∈
有X∪ {x}为U的连通子集.
证明 由
x∈
可知, 至少存在一个xi∈ X, 使得x∈ x'i-X, 于是根据'算子的定义有, (x, xi)∈ R.又因X为连通子集, 故可知xi可经过若干顶点到达任意的xj∈ X, 进而x可经过xi到达任意的xj∈ X, 因此可证X∪ {x}为对象集U的连通子集.
由定义7可知, 全局网络形式概念和局部网络形式概念分别是在概念和半概念的基础上引入集合的连通性而提出的, 因此获取这两类网络形式概念的一个关键问题是如何得到对象子集连通性判别的有效方法.由第2节可知, 等势概念与连通集具有密切的关系, 于是, 本节通过等势概念提出这两类网络概念的获取方法.
根据全局网络形式概念的定义可知, 要获取该类网络形式概念, 在(U, A, I)的概念已知的条件下, 只需判定(U, A, I)中概念外延是否为连通集即可.而由引理1可知, 由(U, U, R)的等势概念可直接获取所有的完全连通子集.因此, 基于(U, U, R)中概念, 可得如下定理.
定理3 设(U, A, R, I)为一个网络形式背景, L(U, U, R)为(U, U, R)的概念集合.对于任意的(X, B)∈ L(U, A, I)(X≠ Ø 且B≠ Ø ), 下列结论成立:
1)若存在(Y, C)∈ L(U, U, R), 有Y=C且X⊆Y, 则(X, B)为全局网络形式概念;
2)若存在(Y, C)∈ L(U, U, R), 有Y∩ C≠ Ø , 且X=Y或X=C, 则(X, B)为全局网络形式概念.
证明 先证1).若存在(Y, C)∈ L(U, U, R), 使得Y=C, 则Y为U的极大完全连通子集.又因为X⊆Y, 由引理1可得, X为U的完全连通子集, 故(X, B)∈ L(U, A, I)为全局网络形式概念.
再证2).因为(Y, C)∈ L(U, U, R), 故可知∀ x∈ Y, ∀ y∈ C, 都有(x, y)∈ R.而由Y∩ C≠ Ø 可知, 一定存在z∈ Y∩ C, 即z∈ Y且z∈ C.因为z∈ C, 所以由概念的定义可知, ∀ xi∈ Y, xj∈ Y, 有(xi, z)∈ R且(xj, z)∈ R; 而z∈ Y, 所以xi可经过z到达xj, 进而由xi、xj的任意性可知, Y为U的连通子集, 同理可得, C为U的连通子集.因此可证, 当X=Y或X=C时, (X, B)∈ L(U, A, I)为全局网络形式概念.
定理3说明可从形式背景(U, U, R)中的概念得到一部分全局网络形式概念.为了进一步借助(U, U, R)中的等势概念给出获取所有全局网络形式概念的方法, 下面给出由(U, U, R)的等势概念获取其子背景(X, X, RX)(X⊆U, RX=R∩ (X× X))等势概念的方法.此前, 对于特定集合{(X, X)|X⊆U}, 本文规定其中任意两个元素之间的偏序关系为
(X1, X1)≤ (X2, X2) ⇔ X1⊆X2.
引理2 设(U, A, R, I)为一个网络形式背景, EL(U, U, R)为(U, U, R)的等势概念集合.对∀ X⊆U, 记
B={(X∩ Xi, X∩ Bi)|(Xi, Bi)∈ EL(U, U, R)},
则有
EL(X, X, RX)=max B,
其中max B为偏序集(B, ≤ )的所有极大元的集合.
证明 第一步证明EL(X, X, RX)⊆max B.对∀ (Y, C)∈ EL(X, X, RX), 首先证明(Y, C)∈ B.由(Y, C)∈ EL(X, X, RX)可知, Y=C且Y⊆X为X的极大完全连通子集.进一步有Y为U的完全连通子集, 故存在U的一个极大完全连通子集Xi, 满足Y⊆Xi且
(Xi, Bi)∈ EL(U, U, R),
因此Y⊆X∩ Xi且X∩ Xi⊆Xi为X的完全连通子集.又因为Y为X的极大完全连通子集, 因此
Y=X∩ Xi,
进而有
C=X∩ Bi,
即∀ (Y, C)∈ EL(X, X, RX), 存在(Xi, Bi)∈ EL(U, U, R), 使得
(Y, C)=(X∩ Xi, X∩ Bi)∈ B.
其次证明(Y, C)∈ max B.假设存在
(X∩ Xj, X∩ Bj)∈ B,
有
(Y, C)≤ (X∩ Xj, X∩ Bj),
即Y⊆X∩ Xj, 又因为Y为X的极大完全连通子集, 所以
Y=X∩ Xj,
因此(Y, C)∈ max B.故EL(X, X, RX)⊆max B.
第二步证明max B⊆EL(X, X, RX), 即证
∀ (X∩ Xi, X∩ Bi)∈ max B,
有(X∩ Xi, X∩ Bi)∈ L(X, X, RX)且
X∩ Xi=X∩ Bi.
对于任意的(X∩ Xi, X∩ Bi)∈ max B, 由B的定义可知(Xi, Bi)∈ EL(U, U, R), 所以(Xi, Bi)∈ L(U, U, R), Xi=Bi且Xi× Bi⊆R.因为
(X∩ Xi)⊆Xi, (X∩ Bi)⊆Bi,
所以
(X∩ Xi)× (X∩ Bi)⊆R.
又因为
(X∩ Xi)⊆X, (X∩ Bi)⊆X,
故
(X∩ Xi)× (X∩ Bi)⊆X× X,
于是有
(X∩ Xi)× (X∩ Bi)⊆R∩ (X× X)=RX,
从而根据概念诱导算子'的性质可知
(X∩ Xi)⊆
假设
(X∩ Xi)⊂
即存在x∈
(X∩ Bi)∪ {x}⊆Bj .
又因为
(X∩ Bi)∪ {x}⊆X,
所以
(X∩ Bi)∪ {x}⊆X∩ Bj,
进而有
X∩ Bi⊂(X∩ Bi)∪ {x}⊆X∩ Bj,
即存在一个(X∩ Xj, X∩ Bj)∈ B, 使得
X∩ Bi⊂X∩ Bj,
与
(X∩ Xi, X∩ Bi)∈ max B
矛盾.因此,
X∩ Xi=
同理可得
所以
(X∩ Xi, X∩ Bi)∈ L(X, X, RX).
又因为Xi=Bi, 所以
X∩ Xi=X∩ Bi.
综上可得
(X∩ Xi, X∩ Bi)∈ EL(X, X, RX),
进而有
max B⊆EL(X, X, RX).
例3 针对表1的网络形式背景, 取对象子集
X={x1, x2, x3, x5},
根据定义3, 可得X在形式背景(U, U, R)中对应的子背景(X, X, RX), 具体如表2所示.
| 表2 子背景(X, X, RX) Table 2 A subcontext (X, X, RX) |
一方面, 由定义2, 根据概念诱导算子可得
EL(X, X, RX)={(x2x5, x2x5), (x1x3x5, x1x3x5)}.
另一方面, 根据引理2 与例2可得
B={(x2x5, x2x5), (x2, x2), (x1x3x5, x1x3x5)},
进而有
max B={(x2x5, x2x5), (x1x3x5, x1x3x5)}.
于是可得
EL(X, X, RX)=max B.
借鉴定理1的思路, 结合引理2, 可得由子背景的等势概念获取全局网络概念的方法.
定理4 设(U, A, R, I)为一个网络形式背景, EL(X, X, RX)为子背景(X, X, RX)的等势概念的集合.对任意的(X, B)∈ L(U, A, I)(X≠ Ø 且B≠ Ø ), 记M0, M1, …,
M0={
M1=
{
︙
∀
则如下结论成立:
1)若存在0≤ k≤ |X|-1, 有|Mk|=1, 则(X, B)为全局网络形式概念;
2)若存在0≤ k≤ |X|-1, 有Mk-1=Mk且|Mk|≥ 2, 则(X, B)不是全局网络形式概念.
证明 由Mk的构造方法及连通图的分解性易知, Mk(0≤ k≤ |X|-1)中的元素都是X的连通子集, 对于任意的X⊆U(X≠ Ø ), X要么为U的连通子集, 要么为U的非连通子集.由M0的有限性可知, 一定存在一个0≤ k≤
先证1).当
2)当Mk=Mk+1且
Mk=Mk+1=…=
且
不失一般性, 设
Mk={Y1, Y2, …, Yt}, t≥ 2,
则显然有
由Mk=Mk+1可知, ∀ Yi∈ Mk, Yj∈ Mk, Yi≠ Yj, 都有
Yi∩ Yj=Ø .
进一步地, 假设存在yi∈ Yi, yj∈ X-Yi, 使得(yi, yj)∈ RX, 则{yi, yj}为X的完全连通子集, 进而存在Yk∈ Mk, 使得{yi, yj}⊆Yk.若Yi=Yk, 则yj∈ Yi, 这样存在矛盾.若Yi≠ Yk, 则Yi∩ Yk≠ Ø , 这样也存在矛盾.因此, ∀ yi∈ Yi, yj∈ X-Yi, 都有(yi, yj)∉RX.由yi、yj的任意性可知, yi不能经过若干顶点到达yj, 所以X是不连通的, 进而可证(X, B)不是全局网络形式概念.
基于定理3和定理4, 下面给出从网络形式背景(U, A, R, I)出发获取全局网络形式概念的步骤.
1)计算L(U, A, I)和L(U, U, R).
2)对于任意的(X, B)∈ L(U, A, I)(X≠ Ø 且B≠ Ø ), 利用定理3判断其是否为全局网络形式概念, 并将由此得到的全局网络形式概念的集合记为N1(U, A, R, I).
3)∀ (X, B)∈ L(U, A, I)-N1(U, A, R, I)(X≠ Ø 且B≠ Ø ), 首先根据引理2获取子背景(X, X, RX)的等势概念, 其次计算X的子集族序列
{Mk
最后根据定理4判断(X, B)是否为全局网络形式概念.
在3)中, 集合连通性的判定算法如下所示.
算法2 对象子集X的连通性判别
输入 EL(U, U, R), 线索集X
输出 True or False
初始化 M0=Ø
根据引理2计算EL(X, X, RX)
M0=ELX(X, X, RX)
If |M0|=1
返回True
Break
Else
k=1∶ |X|-1, Mk=Ø
For
Ai=Ø
For
If
Ai← Ai∪
Mk← Mk∪ {Ai}
End if
End for
End for
End if
If |Mk|=1
返回True
Break
End if
If Mk-1=Mk(k≥ 1)且 |Mk|≥ 2
返回False
Break
End if
算法2的时间复杂度为O(|X|m+|X|m2), 空间复杂度为O(|X|m), 其中m=|EL(U, U, R)|.
例4 继续以表1的网络形式背景为例进行分析, 基于等势概念的获取全局网络形式概念的详细过程如下.
1)由例1和例2可得表1的L(U, A, I)和L(U, U, R).
2)根据定理3中1)可得
(x1, a2a3a5)∈ N(U, A, R, I), (x5, a1a3a4a5)∈ N(U, A, R, I), (x6, a1a2a4a5)∈ N(U, A, R, I), (x1x3, a2a3)∈ N(U, A, R, I), (x1x5, a3a5)∈ N(U, A, R, I), (x1x6, a2a5)∈ N(U, A, R, I), (x2x6, a1a2a4)∈ N(U, A, R, I), (x1x3x5, a3)∈ N(U, A, R, I).
对于
(x2x4x5x6, a1a4)∈ L(U, A, I),
因为存在
(x2x4x5x6, x2)∈ L(U, U, R),
且
{x2, x4, x5, x6}∩ {x2}≠ Ø ,
所以根据定理3中2)可知
(x2x4x5x6, a1a4)∈ N(U, A, R, I).
于是, 可得
$ \begin{aligned} N_{1}(U, A, R, I)= & \left\{\left(x_{1}, a_{2} a_{3} a_{5}\right), \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right), \right. \\ & \left(x_{1} x_{3}, a_{2} a_{3}\right), \left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right), \\ & \left(x_{1} x_{5}, a_{3} a_{5}\right), \left(x_{1} x_{6}, a_{2} a_{5}\right), \\ & \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right), \left(x_{1} x_{3} x_{5}, a_{3}\right), \\ & \left.\left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right)\right\} . \end{aligned} $
3)由1)、2)可得
$ \begin{array}{l} L(U, A, I)-N_{1}(U, A, R, I)-\{(U, \emptyset), (\emptyset, A)\}= \\ \quad\left\{\left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right), \left(x_{4} x_{5} x_{6}, a_{1} a_{4} a_{5}\right), \left(x_{1} x_{4} x_{5} x_{6}, a_{5}\right)\right\} . \end{array} $
对于概念(x1x2x3x6, a2), 令
X1={x1, x2, x3, x6}.
由例2和引理2知
EL(X1, X1,
进而可得
M0={{x2, x6}, {x1, x3, x6}}.
根据定理4可得
M1={{x1, x2, x3, x6}},
此时
(x1x2x3x6, a2)∈ N(U, A, R, I).
类似于上述过程, 对于概念(x4x5x6, a1a4a5), 令
X2={x4, x5, x6}.
首先, 由例2和引理2可知
EL(X2, X2,
于是
M0={{x4}, {x5, x6}}.
又根据定理4可得
M1={{x4}, {x5, x6}},
此时M0=M1,
(x4x5x6, a1a4a5)∉N(U, A, R, I).
同理, 对于概念(x1x4x5x6, a5), 可得
(x1x4x5x6, a5)∉N(U, A, R, I).
综上所述, 网络形式背景(U, A, R, I)的全局网络形式概念如下:
$ \begin{array}{l} \left(x_{1}, a_{2} a_{3} a_{5}\right), \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right), \left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right), \\ \left(x_{1} x_{3}, a_{2} a_{3}\right), \left(x_{1} x_{5}, a_{3} a_{5}\right), \left(x_{1} x_{6}, a_{2} a_{5}\right), \\ \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right), \left(x_{1} x_{3} x_{5}, a_{3}\right), \left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right), \\ \left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right) . \end{array} $
该结论与例1一致.
根据局部网络形式概念的定义, 基于性质2, 给出局部网络形式概念的一个等价描述.
定理5 设(U, A, R, I)为一个网络形式背景, X⊆U(X≠ Ø )为对象集U的连通子集.若X* ≠ Ø 且
$ \left(X^{* * }-X\right) \cap\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right)=\emptyset, $
则(X, X* )为局部网络形式概念.
证明 由
$ \left(X^{* * }-X\right) \cap\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right)=\emptyset $
可知, ∀ x∈ X* * -X, 都有
$ x \notin\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right), $
所以∀ xi∈ X, 都有x∉x'i-X, 即(x, xi)∉R, 因此x与X中的任意一个对象之间都不存在边, 故X∪ {x}是不连通的.于是, 根据定义7中2)可得, (X, X* )为局部网络形式概念.
由于全局网络形式概念一定是局部网络形式概念, 并且由局部网络形式概念的定义可知, 获取局部网络形式概念的关键还是在于集合连通性的判别, 于是在定理5的基础上, 给出局部网络形式概念的获取方法.
定理6 设(U, A, R, I)为一个网络形式背景, L(U, U, R)为(U, U, R)的概念集合.对于任意的X⊆U(X≠ Ø 且X* ≠ Ø ), 下列结论成立:
1)若存在(Y, C)∈ L(U, U, R), 有
Y=C, X⊆Y
且
$ \left(X^{* * }-X\right) \cap\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right)=\emptyset \text {, } $
则(X, X* )为局部网络形式概念;
2)若存在(Y, C)∈ L(U, U, R), 有Y∩ C≠ Ø , X=Y或X=C, 且
$ \left(X^{* * }-X\right) \cap\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right)=\emptyset, $
则(X, X* )为局部网络形式概念.
证明 由定理3和定理5易证.
定理7 设(U, A, R, I)为一个网络形式背景, EL(X, X, RX)为子背景(X, X, RX)的等势概念的集合.对∀ X⊆U(X≠ Ø 且X* ≠ Ø ), 记M0, M1, …,
$ \begin{array}{l} M _{0}=\left\{Y_{i}^{0} \mid\left(Y_{i}^{0}, C_{i}^{0}\right) \in E L\left(X, X, R_{X}\right)\right\}, \\ M _{1}=\left\{Y_{i}^{1}=\cup\left\{Y_{j}^{0} \mid Y_{i}^{0} \cap Y_{j}^{0} \neq \emptyset, \forall Y_{j}^{0} \in M _{0}\right\} \mid\right. \\ \left.\quad \forall Y_{i}^{0} \in M _{0}\right\}, \\ \vdots \\ \stackrel{}M_{|X|-1}=\left\{Y_{i}^{|X|-1}=\cup\left\{Y_{j}^{|X|-2} \mid Y_{i}^{|X|-2} \cap Y_{j}^{|X|-2} \neq \emptyset, \right.\right. \\ \left.\left.\quad \forall Y_{j}^{|X|-2} \in M _{|X|-2}\right\} \mid \forall Y_{i}^{|X|-2} \in m_{|X|-2}\right\}, \end{array} $
若存在0≤ k≤
$ \left(X^{* * }-X\right) \cap\left(\cup_{x_{i} \in X} x_{i}^{\prime}-X\right)=\emptyset, $
则(X, X* )为局部网络形式概念.
证明 由定理4和定理5易证.
基于定理6和定理7, 下面给出从网络形式背景(U, A, R, I)出发获取局部网络形式概念的步骤.
1)计算L(U, U, R).
2)对于任意的X⊆U(X≠ Ø 且X* ≠ Ø ), 利用定理6判断(X, X* )是否为局部网络形式概念, 并将由此得到的局部网络形式概念的集合记为
3)对于其余对象子集X⊆U(X≠ Ø 且X* ≠ Ø ), 首先根据引理2获取子背景(X, X, RX)的等势概念, 其次计算X的子集族序列
{Mk|0≤ k≤ |X|-1},
最后根据定理7判断(X, X* )是否为局部网络形式概念.
例5 以表1的网络形式背景为例, 基于等势概念的局部网络形式概念获取过程具体如下.
由定义7可知N(U, A, R, I)⊆NL(U, A, R, I), 所以由例4可知
$ \begin{array}{l} \left(x_{1}, a_{2} a_{3} a_{5}\right) \in N_{L}(U, A, R, I), \\ \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right) \in N_{L}(U, A, R, I), \\ \left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right) \in N_{L}(U, A, R, I), \\ \left(x_{1} x_{3}, a_{2} a_{3}\right) \in N_{L}(U, A, R, I), \\ \left(x_{1} x_{5}, a_{3} a_{5}\right) \in N_{L}(U, A, R, I), \\ \left(x_{1} x_{6}, a_{2} a_{5}\right) \in N_{L}(U, A, R, I), \\ \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right) \in N_{L}(U, A, R, I), \\ \left(x_{1} x_{3} x_{5}, a_{3}\right) \in N_{L}(U, A, R, I), \\ \left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right) \in N_{L}(U, A, R, I), \\ \left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right) \in N_{L}(U, A, R, I) . \end{array} $
下面考虑其它对象子集.
对于集合X1={x3, x6}, 由例2可知
(x1x3x5x6, x1x3x5x6)∈ EL(U, U, R),
于是由引理1可得X1是连通的, 进一步有
所以
又因为
由此可得
$ \left(X_{1}^{* * }-X_{1}\right) \cap\left(\cup_{x \in X_{1}} x^{\prime}-X_{1}\right)=\left\{x_{1}, x_{2}\right\} \neq \varnothing, $
所以根据定理5可得
(x3x6, a2)∉NL(U, A, R, I).
对于集合X2={x1, x5, x6}, 由例2可知
(x1x3x5x6, x1x3x5x6)∈ EL(U, U, R),
于是由引理1可得, X2是连通的, 进一步有
$ \begin{array}{l} X_{2}^{* }=\left\{a_{5}\right\}, \\ X_{2}^{* * }=\left\{x_{1}, x_{4}, x_{5}, x_{6}\right\}, \end{array} $
所以
又因为
$ \begin{aligned} \cup_{x_{i} \in X} x_{i}^{\prime}-X= & \left\{x_{1}, x_{2}, x_{3}, x_{5}, x_{6}\right\}-\left\{x_{1}, x_{5}, x_{6}\right\}= \\ & \left\{x_{2}, x_{3}\right\}, \end{aligned} $
由此可得
$ \left(X_{2}^{* * }-X_{2}\right) \cap\left(\cup_{x \in X_{2}} x^{\prime}-X_{2}\right)=\emptyset, $
所以根据定理5可得
(x1x5x6, a5)∈ NL(U, A, R, I).
同理可得
(x4, a1a4a5)∈ NL(U, A, R, I), (x5x6, a1a4a5)∈ NL(U, A, R, I).
综上所述, 网络形式背景(U, A, R, I)的局部网络形式概念如下:
$ \begin{array}{l} \left(x_{1}, a_{2} a_{3} a_{5}\right), \left(x_{5}, a_{1} a_{3} a_{4} a_{5}\right), \left(x_{6}, a_{1} a_{2} a_{4} a_{5}\right), \\ \left(x_{1} x_{3}, a_{2} a_{3}\right), \left(x_{1} x_{5}, a_{3} a_{5}\right), \left(x_{1} x_{6}, a_{2} a_{5}\right), \\ \left(x_{2} x_{6}, a_{1} a_{2} a_{4}\right), \left(x_{1} x_{3} x_{5}, a_{3}\right), \left(x_{1} x_{2} x_{3} x_{6}, a_{2}\right), \\ \left(x_{2} x_{4} x_{5} x_{6}, a_{1} a_{4}\right), \left(x_{1} x_{5} x_{6}, a_{5}\right), \left(x_{4}, a_{1} a_{4} a_{5}\right), \\ \left(x_{5} x_{6}, a_{1} a_{4} a_{5}\right) . \end{array} $
该结论与例1一致.
本文算法1的作用仅是从理论角度丰富连通集的获取方法, 故本节对算法2进行评估.
实验选取如下8个数据集评估算法性能.
1)6个UCI数据库上的真实数据集:Cervical Cancer Behavior Risk(CCBR)、Higher Education Stu- dents Performance Evaluation(HESPE)、Connectionist Bench(CB)、 Musk(Version 1)、Breast Cancer Wiscon- sin(BCW)、Mice Protein Expression(MPE)数据集.
2)2 个随机生成的数据集:RGD1、RGD2数据集.
具体数据集信息如表3所示, 表中|U|表示对象个数, |A|表示属性个数.
| 表3 实验数据集及参数 Table 3 Experimental datasets and parameters |
为了验证算法2的有效性, 使用算法2计算全局网络形式概念和局部网络形式概念, 并与文献[17]中的算法1和算法2分别进行对比.
实验1为全局网络形式概念的对比实验, 实验2为局部网络形式概念的对比实验.由于在实验1中两种算法均涉及计算形式背景(U, A, I)的概念, 故此过程耗时不予考虑, 重点分析概念外延的连通性判定耗时.
此外, 为了确保算法验证的严谨性, 实验中对所有的全局网络形式概念进行完整枚举, 以验证算法结果的正确性.
在计算全局网络形式概念和局部网络形式概念的过程中, 关于集合连通性判定过程是相同的.在评估算法的有效性时, 计算单个结果与计算所有结果并无本质区别, 其正确性由算法逻辑的一致性保证, 而效率差异仅反映问题规模的变化.因此, 实验2中只对比计算一个对象子集生成局部网络概念的耗时.
为了减少实验过程中的偶然误差, 两种算法均进行5次实验, 并取平均值作为最终的运行时间, 以此提升时间对比结果的准确性和可靠性.
在8个数据集上, 利用两种算法得到所有全局网络形式概念的耗时及概念个数的结果如表4所示.由表可见, 两种算法的全局网络形式概念计算结果一致, 由此验证本文算法2的正确性.此外, 表4表明本文算法2在不同数据集上计算全局网络概念的运行时间均低于对比算法, 在个别数据集上还有显著优势.
| 表4 两种算法计算全局网络形式概念的耗时与概念个数对比 Table 4 Comparison of runtime and the number of concepts between 2 algorithms for computing global network formal concepts |
两种算法分别计算局部网络形式概念的耗时如表5所示.由表可见, 本文算法2在大多数数据集上计算局部网络形式概念的运行时间低于对比算法.由于数据集规模由小到大排列, 从而由表5可得出:随着数据集规模的逐渐增大, 算法2的运行时间的增加幅度相对平缓, 这表明其在较大规模数据集上具有一定的适用性.
| 表5 两种算法计算局部网络形式概念的耗时对比 Table 5 Runtime comparison between 2 algorithms for computing local network formal concepts s |
本文利用网络形式背景(U, A, R, I)既包含对象与属性之间的信息(U, A, I), 也包含对象与对象之间的信息(U, U, R)的特点, 并借助(U, U, R)的等势概念, 提出两类网络形式概念的获取方法.首先, 从(U, U, R)的等势概念得到U的所有连通子集的获取方法, 并通过概念诱导算子分析连通集的性质.然后, 针对全局网络形式概念, 通过(U, U, R)的等势概念与其子背景等势概念的联系, 给出判别(U, A, I)中任意概念是全局网络形式概念的方法, 并进一步得到获取所有局部网络形式概念的方法.最后通过实验说明本文两类网络形式概念获取方法的有效性.
由于现实生活中的数据动态变化, 因此在上述研究的基础上, 还可进一步探讨当网络形式背景动态变化时两类网络形式概念的更新规律.后续研究还可考虑使用更高效的幂集计算算法优化算法1, 使用高效的极大元查找算法优化算法2 .此外, 今后可进一步考虑将连通性引入三元概念分析中, 研究网络三元背景的知识获取等问题.
本文责任编委 张燕平
Recommended by Associate Editor ZHANG Yanping
| [1] |
|
| [2] |
|
| [3] |
|
| [4] |
|
| [5] |
|
| [6] |
|
| [7] |
|
| [8] |
|
| [9] |
|
| [10] |
|
| [11] |
|
| [12] |
|
| [13] |
|
| [14] |
|
| [15] |
|
| [16] |
|
| [17] |
|
| [18] |
|
| [19] |
|
| [20] |
|
| [21] |
|
| [22] |
|

