模式识别与人工智能
2025年3月17日 星期一   首 页     期刊简介     编委会     投稿指南     伦理声明     联系我们                                                                English
模式识别与人工智能  2016, Vol. 29 Issue (5): 385-392    DOI: 10.16451/j.cnki.issn1003-6059.201605001
论文与报告 最新目录| 下期目录| 过刊浏览| 高级检索 |
发音过程中舌头运动的3D可视化方法*
李睿1,2,3,於俊2,3,罗常伟2,3,汪增福1,2,3
1.中国科学院合肥智能机械研究所 核环境遥操纵机器人研究室 合肥 230031
2.中国科学技术大学 语音及语言信息处理国家工程实验室 合肥 230027
3.中国科学技术大学 信息科学技术学院 合肥 230027
3D Visualization Method for Tongue Movements in Pronunciation
LI Rui1,2,3, YU Jun2,3, LUO Changwei2,3, WANG Zengfu1,2,3
1.Laboratory of Nuclear Environment Telerobot, Institute of Intelligent Machines, Chinese Academy of Sciences, Hefei 230031
2. National Engineering Laboratory for Speech and Language Information Processing, University of Science and Technology of China, Hefei 230027
3.School of Information Science and Technology, University of Science and Technology of China, Hefei 230027

全文: PDF (1434 KB)   HTML (1 KB) 
输出: BibTeX | EndNote (RIS)      
摘要 研究中文发音过程中舌头运动的3D可视化问题。根据核磁共振数据构建舌头精细的3D模型,在此基础上,提取舌背表面处3个点的EMA数据为驱动源,利用弹簧网技术真实再现中文发音过程中的舌头运动。为了验证文中建模和舌头运动合成方法的有效性,使用计算机图形学的方法模拟舌头运动的细节效果,并对比其与由语言学家亲自拍摄的“普通话发音器官动作特征”的X光影像。实验表明,文中方法实现的3D舌头运动符合真实的舌头运动情况,拥有广泛的应用前景。
服务
把本文推荐给朋友
加入我的书架
加入引用管理器
E-mail Alert
RSS
作者相关文章
李睿
於俊
罗常伟
汪增福
关键词 3D可视化发音动画舌头建模舌头运动模拟碰撞处理    
Abstract:Problem of 3D visualization of tongue movements in pronunciation is studied. Firstly, a precise 3D tongue model according to magnetic resonance imaging scan data is built. Based on the 3D tongue model, the electromagnetic articulometer(EMA) data collected from three points on tongue dorsum surface are used as the driven data. The mass spring technique is used to realize realistic tongue movements in pronunciation. To evaluate the effect of modeling and synthesis methods for tongue movements, the computer graphics techniques are employed to simulate the detailed effect of the tongue movements. Finally, the simulation results are compared with X-ray video of the motion characteristics of articulators for Mandarin Chinese recorded by a pronunciation specialist. The experimental result shows the proposed method achieves precise and realistic results of 3D tongue movements and it has a wide application prospect.
Key words3D Visual Speech Animation    Tongue Modeling    Tongue Movement Simulation    Collision Handling   
收稿日期: 2015-09-10     
基金资助:国家自然科学基金项目(No.61472393,61303150)资助
作者简介: 李睿,女,1989年生,博士研究生,主要研究方向为计算机图形学、可视化语音处理、人机交互.E-mail:ruili89@mail.ustc.edu.cn.
於俊,男,1982年生,博士,副研究员,主要研究方向为人机交互、计算机图形学、可视化语音处理.E-mail:harryjun@ustc.edu.cn.
罗常伟,男,1985年生,博士,主要研究方向为计算机图形学、人机交互、视频跟踪.E-mail:luocw@mail.ustc.edu.cn.
汪增福(通讯作者),男,1960年生,博士,教授,主要研究方向为计算机视觉、模式识别、语音可视化、人机交互、智能机器人.E-mail:zfwang@ustc.edu.cn.
引用本文:   
李睿,於俊,罗常伟,汪增福. 发音过程中舌头运动的3D可视化方法*[J]. 模式识别与人工智能, 2016, 29(5): 385-392. LI Rui, YU Jun, LUO Changwei, WANG Zengfu. 3D Visualization Method for Tongue Movements in Pronunciation. , 2016, 29(5): 385-392.
链接本文:  
http://manu46.magtech.com.cn/Jweb_prai/CN/10.16451/j.cnki.issn1003-6059.201605001      或     http://manu46.magtech.com.cn/Jweb_prai/CN/Y2016/V29/I5/385
版权所有 © 《模式识别与人工智能》编辑部
地址:安微省合肥市蜀山湖路350号 电话:0551-65591176 传真:0551-65591176 Email:bjb@iim.ac.cn
本系统由北京玛格泰克科技发展有限公司设计开发 技术支持:support@magtech.com.cn