多模态注意力感知与相邻尺度建模的Transformer网络
宋霄罡
1,
2
, 张浩泽
1
, 张小龙
1
, 赵钦
2,
3
, 黑新宏
1,
2
, 何敏
3
Transformer Network with Multimodal Attention Perception and Adjacent-Scale Modeling
SONG Xiaogang
1,
2
, ZHANG Haoze
1
, ZHANG Xiaolong
1
, ZHAO Qin
2,
3
, HEI Xinhong
1,
2
, HE Min
3
MAFM结构图