本文从新的角度回顾科学和哲学的本源,认为需要以新的思想发展人工智能和智能技术及其相应的智慧社会.围绕卡尔·波普尔的三个交织世界的现实观,提出面向描述知识、预测知识和引导知识的平行哲学理念,使关于智能的哲学之研究对象从Being,Becoming到Believing,并讨论结合区块链DAO技术与范畴数学理论的可能实施途径.
同构行人再识别技术研究基于可见光图像的行人检索问题,但无法完全应对复杂多变真实场景,大量研究工作开始探索基于可见光图像与其它异构数据之间的行人检索问题,即跨模态异构行人再识别.该研究相比同构行人再识别,更具挑战性.文中首先简述跨模态异构行人再识别的概念及与一般行人再识别的区别,再针对文本与图像、图像与视频、跨分辨率图像、红外图像与可见光图像、深度图与可见光图像、素描与可见光图像这6类场景,归纳整理和分析跨模态异构行人再识别的代表性工作、常用数据集及一些算法的性能表现.最后,总结目前整体研究进展,展望未来发展趋势.
为了提高基于生成对抗网络(GAN)的零样本识别方法的识别精度,提出结合迁移引导和双向循环结构GAN的零样本文本识别方法.构造双向循环结构GAN以提高模型的生成能力,生成的伪特征更接近输入的真实特征.引入迁移引导学习的思想,使用迁移后的文本代替可见类文本训练模型,提高不可见类文本的识别精度.增加有效的正则化项,使生成器在训练过程中生成的结果具有多样性,提高生成模型的稳定性.在数据集上的实验表明,文中方法可提高识别精度,具有较好的泛化性能,容易拓广到其它应用中.
为了提高足迹压力图像检索的精度,提出基于多尺度自注意卷积的足迹压力图像检索算法.首先,对足迹压力图像进行角度校正、对齐、擦除等预处理操作,减小图像角度等因素对特征提取的影响.再由多个并行分支的空洞卷积和自适应注意模块构成的多尺度自注意卷积模块自适应地提取可判别特征.最后,由全局特征分支、残缺性评分掩模分支构成残缺性评分模块,得到共同残缺性评分矩阵,利用该评分矩阵对可判别特征进行加权组合,提高网络对残缺足迹共同可见区域的关注程度.实验表明,在构建的FootPrintImage数据集上,文中算法具有较高的首中准确率和平均检索精度.
在热成像图目标检测中,存在图像的纹理单一、目标边界模糊等退化现象,这造成目标定位困难、目标与预定义锚点框无法精准匹配等问题.因此,文中提出基于特征对齐和关键点辅助激励的退化热成像图目标检测算法.引入可见光图分支,计算2个分支指定层的特征差异,提升热成像域与可见光域之间的相似度.为了丰富网络高层中的目标细节信息,修改特征图级联和检测尺度.部署包含关键点辅助激励的无锚点检测器,较好地定位目标并学习预定义锚点框覆盖较差的实例.在2个数据集上的对比实验表明,文中算法可准确定位热成像目标,有效提升退化热成像图目标检测精度.
在自编码的学习过程中如何更好地保留原始特征及消除多模态数据分布的差异是一个重要的研究课题.因此,文中提出基于双对抗自编码器(DAA)的跨模态检索方法.使用全局对抗网络改进自编码器模态内重构过程,极小极大博弈的策略使模态内的原始特征和重构特征难以判别,更好地保留原始特征.隐含层对抗网络在生成模态不变表示的同时使模态间数据难以区分,有效减小多模态数据的分布差异.在Wikipedia、NUS-WIDE-10k数据集上的实验证明DAA的有效性.
针对含有复杂图案的纺织品瑕疵检测问题,提出基于畸变校正与视觉显著特征的纺织品瑕疵检测方法.首先,计算图像周期,获取最佳分块模板,根据模板对图像进行畸变校正.再对图像进行卡通纹理层分解,只保留具有图像主要特征的卡通层.然后,采用改进的上下文视觉显著性算法提取卡通层的显著性特征,分离具有高显著性特征的瑕疵与低显著性特征的背景.最后,采用K-means聚类算法突出显著图中的瑕疵,完成瑕疵检测.实验表明,文中方法对星型、箱型和点型图案纺织品的瑕疵检测的平均查全率较高,同时平均查全-查准效果也较优.
当布匹的背景信息复杂多变时,复杂花色布匹的瑕疵定位与分类较为困难.针对这一问题,文中提出基于级联卷积神经网络的复杂花色布匹瑕疵检测算法.首先,使用双路残差的骨干特征提取网络,在缺陷图和模板图上提取并融合特征.然后,设计密度聚类边框生产器,指导框架中区域候选网络的预检测框设计.最后,通过级联回归方法完成瑕疵的精确定位和分类.采用工业现场采集的布匹图像数据进行训练与预测,结果表明,文中算法的精准率和召回率较高.