• 北大核心期刊(《中文核心期刊要目总览》2017版)
  • 中国科技核心期刊(中国科技论文统计源期刊)
  • JST 日本科学技术振兴机构数据库(日)收录期刊

留言板

尊敬的读者、作者、审稿人, 关于本刊的投稿、审稿、编辑和出版的任何问题, 您可以本页添加留言。我们将尽快给您答复。谢谢您的支持!

姓名
邮箱
手机号码
标题
留言内容
验证码

视觉常识和二次注意的图像描述

方小龙

方小龙. 视觉常识和二次注意的图像描述[J]. 微电子学与计算机. doi: 10.19304/J.ISSN1000-7180.2021.1226
引用本文: 方小龙. 视觉常识和二次注意的图像描述[J]. 微电子学与计算机. doi: 10.19304/J.ISSN1000-7180.2021.1226
VisualCommonsense and Attention on Attention for Image Captioning[J]. Microelectronics & Computer. doi: 10.19304/J.ISSN1000-7180.2021.1226
Citation: VisualCommonsense and Attention on Attention for Image Captioning[J]. Microelectronics & Computer. doi: 10.19304/J.ISSN1000-7180.2021.1226

视觉常识和二次注意的图像描述

doi: 10.19304/J.ISSN1000-7180.2021.1226

VisualCommonsense and Attention on Attention for Image Captioning

  • 摘要: 图像描述任务可应用于检索系统、盲人导航和医学报告生成等领域。针对现有的图像描述模型对视觉语义关系挖掘不充分,以及多层注意力机制提取的特征存在注意偏差的问题,提出了一种视觉常识和二次注意的图像描述模型。在编解码器结构框架下,编码部分引入视觉常识来指导局部特征产生常识语义关系,并对多层注意力挖掘的高层语义施加二次注意,以增强特征并获得更好的相关性,从而减少注意偏差误导解码端序列生成。在MS COCO数据集上进行测试,实验结果表明,模型在BLEU、CIDEr和SPICE等评价指标上有一定程度的提升,表明了该模型能够更加准确且丰富地表达图像语义内容。

     

  • 加载中
计量
  • 文章访问数:  237
  • HTML全文浏览量:  32
  • PDF下载量:  26
  • 被引次数: 0
出版历程
  • 收稿日期:  2021-11-05
  • 录用日期:  2021-12-01
  • 修回日期:  2021-11-30
  • 网络出版日期:  2021-12-13

目录

    /

    返回文章
    返回