jjzjj

基于自然语言描述的行人检索 Text-based Person Retrieval - 常用数据集 CUHK-PEDES、ICFG-PEDES、RSTPReid

目录Text-basedPersonRetrieval任务介绍常用数据集CUHK-PEDES数据集ICFG-PEDES数据集RSTPReid数据集Text-basedPersonRetrieval任务介绍博主是做多模态相关的,最近刚刚接触了语言行人检索(Text-basedPersonRetrieval)这个任务,觉得挺有意思,开一个专栏来记录一下该任务的常用数据集和一些经典工作。语言行人检索应该算是多模态检索和行人重识别两个任务的交叉子任务,任务本身并不难理解,就是给定一段文本描述当作查询query,然后检索到所描述的行人图片即可,如下图所示。同时,在待检索的图像数据库中,是存在同一人物的不

论文笔记:CVPR2023 IRRA—隐式推理细粒度对齐模型,语言行人检索任务新SOTA,CUHK-PEDES数据集Rank-1可达73.38%!

目录论文基本信息引言模型模态编码器ImplicitRelationReasoning模块与MLM任务SimilarityDistributionMatching结果论文基本信息论文:Cross-ModalImplicitRelationReasoningandAligningforText-to-ImagePersonRetrieval代码:https://github.com/anosorae/IRRA这是今年CVPR2023的工作,也是目前在语言行人检索领域实现SOTA性能的模型,模型整体并不复杂性能却很好,代码也做了开源,是一个非常好的工作。下面将对该文章进行简要的梳理与记录,还不太了解