基于Vision Transformer的中文唇语识别
薛峰
1
, 洪自坤
2
, 李书杰
1
, 李雨
2
, 谢胤岑
2
Chinese Lipreading Network Based on Vision Transformer
XUE Feng
1
, HONG Zikun
2
, LI Shujie
1
, LI Yu
2
, XIE Yincen
2
各模型在CMLR训练集上的错误率下降曲线