注册 / 登录

行人再识别研究前沿:评测数据构建与视觉表示学习

分会场:  人工智能/AI驱动/AI实践

 

案例来源 :

案例讲师

王井东

微软亚洲研究院 视觉计算组资深研究员

微软亚洲研究院视觉计算组资深研究员。研究兴趣包括计算机视觉、多媒体以及机器学习。目前他研究的问题包括高效神经网络结构的设计、行人再识别以及多媒体搜索等。他曾担任过计算机视觉和人工智能会议的领域主席和高级程序委员会委员,比如 CVPR、ICCV、ECCV、AAAI、IJCAI、ACMMM 等。他也是 IEEE 汇刊 IEEE Transactions on Patten Analysis and Machine Intelligence, IEEE Transactions on Circuits and Systems for Video Technology 和 IEEE Transactions on Multimedia 的编委会成员。他是国际模式识别学会的会士。 王博士 在视觉、机器学习以及多媒体领域里发表了论文 100 余篇,个人专著一本。他的研究成果 10 多次转化到微软的关键产品和服务中。

扫描二维码分享案例

 

案例简述

 

行人再识别在学术界与工业界引起了广泛的关注,有很强的商业需求,包括视频监控,无人售货,行为分析等等。这一问题的研究探索,需要足够的数据集,需要鲁棒的行人视觉表达等。在过去几年里,为了推动这一领域的发展,我们做了大量的工作,包括图像和视频行人再识别的两个重要的数据集:Market-1501 和 Mars,这两个数据集已经成为该领域用来评测算法的标准数据集,同时,我们从人如何做行人再识别出发,开发了基于行人部件的行人视觉表示,取得了领先的效果,引起了该领域里的强烈关注。

 

案例目标

 

在监控场景中,行人姿势多变,检测可能不够精确。我们模拟人如何比较两个人的方法,提出了抽取人体部件和组合部件描述的方法,获得了鲁棒的行人视觉表示。除此以外,实际场景不同行人量很大,我们构建了目前行人最多的数据集,是的算法评测更可靠。

 

成功(或教训)要点

 

1. 理解行人再识别的实际应用场景;

2. 数据集构建的合理性;

3. 行人视觉表示的可理解性、效果和计算高效;

4. 总结面临的挑战及技术发展之路。

 

案例ROI分析

 

-

 

案例启示

 

学术研究要更加接近实际应用场景。构建学术成果评测的数据是基础,对筛选优秀实用方法非常重要。同时解决方案要接近实际场景,推动这一领域良性发展。

 

案例在团队中的意义

 

是视觉监控应用的重要技术

 

领取大会PPT

我要参会

大会全套演讲PPT

立即领取

大会即将开幕,点击抢票!

我要参会