针对多属性决策中多个相互冲突的属性信息使决策者很难做出决策判断的问题,文中从支持直觉模糊集的角度研究该问题.首先,在支持直觉模糊集的基础上,结合多粒度粗糙集理论,构造乐观、悲观两种多粒度支持直觉模糊粗糙集模型,分析两种模型之间的相互关系,讨论相关性质.然后,利用t-模和t-余模定义拟合函数,提出多粒度支持直觉模糊粗糙集的多属性决策求解方法,同时定义得分函数和精确函数排序决策结果,提取相应的决策规则,设计算法.实例分析表明,文中方法使决策者在处理信息冲突的多属性决策问题时可根据实际需求选择最优决策方案
现有的用户画像分析模型使用单一模型单一粒度的学习方式处理异构多源的原始数据,限制分析模型的性能,无法完整展示多层次、多角度的用户画像特征.针对该问题,基于粒计算思想,文中提出多粒度用户画像分析模型.首先,构建数据的多粒度表示结构,粒化原始数据.再根据数据粒度结构,提出基于集成学习的粒度提升算法,用于融合低粒层的数据信息以得到高粒层的数据表示.最后,在多个粒层数据表示上进行用户画像分析,展示一个较全面的用户画像.实验表明,相比单一粒度的用户画像,多粒度的用户画像更全面、立体和丰富
全粒度粗糙集时空复杂度较高,难于计算属性约简.针对此问题,文中利用等价类定义信息系统中的可区分度,并研究其性质,证明基于可区分度的属性约简等价于绝对约简.定义决策系统中的正区域可区分度,并探究其性质,证明基于正区域可区分度约简是全粒度Pawlak约简的超集,但绝大部分情况下等于全粒度Pawlak约简,可作为全粒度Pawlak约简的近似.理论分析和实验表明,相比其它属性约简算法,基于正区域可区分度约简在计算复杂度和分类准确率等方面具有较大优势.
已有的基于模糊粗糙集的多标记特征选择算法多从单一的样本空间刻画属性区分能力,忽视属性对标记的区分能力.基于这一认识,文中同时从样本和标记两个空间出发,提出基于双空间模糊辨识关系的多标记特征选择算法.首先,基于模糊辨识关系分别从样本和标记角度定义两种多标记属性重要性度量,然后通过权重融合的方式融合两种度量,基于融合后的度量,运用前向贪心算法构建多标记特征选择算法.在5个数据集上的对比实验验证本文算法的有效性
在多粒度粗糙集模型中,粒度选择总是与正域有关.由于全体标记确定对象集上的分类过细,落入正域的对象很少或为空集,导致正域约简方法可能丢失大量信息甚至失效.为了克服这一缺陷,文中提出基于局部广义多粒度粗糙集的多标记最优粒度选择方法.首先,引入广义局部多粒度粗糙集的相关概念,通过设置信息水平参数,对单个标记的对象集合进行近似.然后,通过定义多粒度多标记信息系统的粒度质量,给出粒度重要性.最后,设计最优粒度选择的启发式算法,并通过实例验证文中方法的有效性
在许多实际应用中,数据经常呈现高维不平衡特征,特征还根据需求在不同时间段动态生成.基于此种情况,文中提出基于邻域粗糙集的高维类不平衡数据的在线流特征选择算法.算法设计基于小类重要度的粗糙依赖度计算公式,同时,提出在线相关性分析、在线冗余度分析、在线重要度分析三种策略,用于选择在大类和小类之间具有高可分离性的特征.在7个高维类不平衡数据集上的实验表明,文中算法可以有效选择一个较好的特征子集,性能较优.
现有的有监督主题模型训练算法的时间复杂度一般线性于主题数量,限制了其大规模应用.基于此种情况,文中提出最大熵判别潜在狄利克雷分配(MedLDA)有监督主题模型的高效学习算法.算法为坐标下降算法,训练分类器的迭代次数少于MedLDA已有的蒙特卡洛算法.算法还利用拒绝采样及高效的预处理技术,将训练的时间复杂度从线性于主题数量降至亚线性于主题数量.在多个文本数据集上的对比实验表明,相比原有的蒙特卡洛算法,文中算法在训练速度上有大幅提升.
有针对性地为用户提供推荐,提高互联网信息利用率是个性化推荐系统的主要目标.文中基于热扩散传播概率模型,结合用户在社交网络中隐含的跟随关系,提出基于热扩散影响力传播的社交网络个性化推荐算法.首先,算法将现实生活中人与人的朋友关系转化为购物网络中用户与用户的跟随关系,构建异构信息网络图,计算用户之间的复合相似度.然后,利用基于热扩散概率模型模拟社会网络中影响力的传播过程,计算社交网络中用户的跟随概率分数并精确排序,筛选与目标用户相似的邻近用户.最后,根据目标邻近用户对各个产品的评分,将评分较高、具有潜在兴趣的产品推荐给目标用户,实现个性化的用户推荐.在公开数据集上与现有的个性化推荐算法进行对比,实验表明,文中算法具有较好的精确度和多样化的推荐效果.
现有的轨道分配工作大多忽略局部线网问题,并且容易陷入局部极值.为此,文中基于离散粒子群优化、遗传操作和基于协商的精炼策略,综合考虑局部线网、重叠冲突、线长和障碍物,提出轨道分配算法.算法抽象局部线网,构建对应的线段模型.为了扩大种群多样性,混合遗传操作以提高全局搜索效率.同时,设计简单高效的适应度函数.最后,使用基于协商的精炼策略进一步减少线段重叠.实验表明文中算法的有效性,该算法可以获得较佳的重叠代价指标优化值,减少关键布线区域的拥挤情况.