模式识别与人工智能
2025年4月4日 星期五   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2007, Vol. 20 Issue (5): 698-703    DOI:
研究与应用 最新目录| 下期目录| 过刊浏览| 高级检索 |
一种有限混合模型对无监督文本聚类的广义方法*
张亮,李敏强
天津大学 管理学院 天津 300072
A Generalized Method for Unsupervised Text Clustering Using Finite Mixture Models
ZHANG Liang, LI Min-Qiang
School of Management, Tianjin University, Tianjin 300072

全文: PDF (371 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 提出一种有限混合模型对无监督文本聚类的广义方法.它将特征对各混合成员的相关性作为隐变量引入混合模型,在一个统一框架中完成混合模型的模型选择、特征选择以及参数估计.在大规模文本数据集上的实验结果表明该方法在模型选择、特征选择和聚类结果3个方面都取得较好效果.
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
张亮
李敏强
关键词 有限混合无监督学习文本聚类特征选择模型选择期望-最大化算法    
Abstract:A generalized method is presented for unsupervised text clustering. The relevance of the features to the mixture components is introduced to the mixture model as a set of latent variables. Then the model selection, feature selection and parameter estimation of the mixture model are integrated into one general framework. Experimental results on four large scale document datasets show that the proposed method achieves fine results in model selection, feature selection and clustering performance.
Key wordsFinite Mixtures    Unsupervised Learning    Document Clustering    Feature Selection    Model Selection    Expectation-Maximization Algorithm   
收稿日期: 2006-07-24     
ZTFLH: TP181  
基金资助:国家自然科学基金项目(No.70571057)、新世纪优秀人才支持计划项目(No.NECT-05-R013)资助
作者简介: 张亮,男,1979年生,博士研究生,主要研究方向为信息检索与信息过滤、人工智能与机器学习.Email:zhangliang.tju@gmail.com.李敏强,男,1965年生,教授,主要研究方向为信息系统与系统工程、进化计算与人工智能.
引用本文:   
张亮,李敏强. 一种有限混合模型对无监督文本聚类的广义方法*[J]. 模式识别与人工智能, 2007, 20(5): 698-703. ZHANG Liang, LI Min-Qiang. A Generalized Method for Unsupervised Text Clustering Using Finite Mixture Models. , 2007, 20(5): 698-703.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2007/V20/I5/698
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn