个人信息
Personal Information
联系方式
Contact Information
个人简介
Personal Profile
汪昱,同济大学计算机科学与技术学院助理教授,上海市启明星计划扬帆专项人才计划项目获得者,于2022年在同济大学计算机科学与技术系获得博士学位,之后在蚂蚁金服公司工作,并于2023年12月加入同济大学。长期围绕多模态技术开展研究,以多模态特征对齐与融合技术为核心,在计算机视觉、开放词汇视觉感知、多模态视频理解与分析以及多模态信息提取领域从事研究。近五年,以第一作者身份在CVPR、TMM、TITS等IEEE汇刊/CCF A类国际顶级刊物上发表论文十余篇(包含一篇ESI高被引论文),申请国家技术发明专利四项,授权两项。在国际顶级多模态领域挑战赛ICDAR 2023信息提取的三个赛道上分别获得第一名、第三名和第四名。主持国家自然科学基金青年基金、上海市“科技创新行动计划”启明星计划扬帆专项人才计划项目和同济大学自主原创基础研究项目。作为核心人员,参与负责国家“十三五”重点研发计划“智能化城市基础设施管控及联网关键技术与应用”中城市场景感知与理解的研究工作,参与负责国家“十四五”重点研发计划 “基于社区典型场景的智慧服务一体化关键技术研究和示范”中多智能体协同优化的研究工作,参与负责国家自然科学基金重点项目“面向海洋鱼类识别的视觉数据智能分析理论与关键技术”中海底图像生成与海洋生物细粒度识别的研究工作。在多个领域均提出了创新性技术理论体系,包括提出一套以语义知识为中心的视频理解与分析理论体系,解决了弱监督场景中的标注稀疏性难题;提出一种多智能体协作学习范式,解决了复杂环境中异构多智能体的细粒度交互难题;首次研制了一种基于弱标注视觉问答机制的信息提取大模型,实现了多模态信息提取的超级自动化能力,已广泛应用在蚂蚁金服以及阿里巴巴等企业的业务中。
1. 国家自然科学基金青年基金:“面向复杂场景车辆轨迹预测的上下文感知与协同优化技术研究”,62406226,2025-2027,主持
2. 上海市“科技创新行动计划”启明星计划扬帆专项: “面向文本视频检索的不确定性表征挖掘与多粒度自适应对齐技术研究”, 24YF2748700, 2024.12-2027.11,主持.
3. 同济大学自主原创项目:“基于图文多模态的车辆轨迹预测技术研究”,2024-2026,主持
4. 国家自然科学基金重点项目:“面向海洋鱼类识别的视觉数据智能分析理论与关键技术”,61936014,2020-2024,参与
5. 国家重点研发计划项目:“智能化城市基础设施管控及联网关键技术与应用”,2019YFB2102300,2019-2022,参与
6. 国家自然科学基金面上项目:“基于视觉的泊车位检测技术中关键问题的研究”,61973235,2020-2023,参与
7. 国家自然科学基金面上项目:“基于图卷积网络的RNA二级/三级结构预测”,61972285,2020-2023,参与
1. 国家自然科学基金青年基金:“面向复杂场景车辆轨迹预测的上下文感知与协同优化技术研究”,62406226,2025-2027,主持
2. 上海市“科技创新行动计划”启明星计划扬帆专项: “面向文本视频检索的不确定性表征挖掘与多粒度自适应对齐技术研究”, 24YF2748700, 2024.12-2027.11,主持.
3. 同济大学自主原创项目:“基于图文多模态的车辆轨迹预测技术研究”,2024-2026,主持
4. 国家自然科学基金重点项目:“面向海洋鱼类识别的视觉数据智能分析理论与关键技术”,61936014,2020-2024,参与
5. 国家重点研发计划项目:“智能化城市基础设施管控及联网关键技术与应用”,2019YFB2102300,2019-2022,参与
6. 国家自然科学基金面上项目:“基于视觉的泊车位检测技术中关键问题的研究”,61973235,2020-2023,参与
7. 国家自然科学基金面上项目:“基于图卷积网络的RNA二级/三级结构预测”,61972285,2020-2023,参与
近五年代表性论文:
1. Yu Wang, Yadong Li andHongbin Wang, “Two-Stream Networks for Weakly-Supervised Temporal ActionLocalization with Semantic-Aware Mechanisms,” in Proceedings of the IEEEConference on Computer Vision and Pattern Recognition (CVPR), 2023, pp.18878-18887, doi: 10.1109/CVPR52729.2023.01810. (CCF A类)
2. Yu Wang, Shengjie Zhaoand Shiwei Chen, “Action-semantic Consistent Knowledge for Weakly-SupervisedAction Localization,” IEEE Transactions on Multimedia, vol. 26, pp.10279-10289, 2024, doi=10.1109/TMM.2024.3405710. (IEEE 汇刊、中科院一区)
3. Yu Wang, Shengjie Zhaoand Shiwei Chen, “SQL-Net: Semantic Query Learning for Point-SupervisedTemporal Action Localization”, IEEE Transactions on Multimedia, 2024.(Accepted) (IEEE 汇刊、中科院一区)
4. Yu Wang and Shiwei Chen,“Multi-Agent Trajectory Prediction with Spatio-Temporal Sequence Fusion,” IEEETransactions on Multimedia, vol. 25, pp. 13-23, 2023, doi:10.1109/TMM.2021.3120535. (IEEE 汇刊、中科院一区)
5. Yu Wang, Shengjie Zhao,Rongqing Zhang, Xiang Cheng and Liuqing Yang, “Multi-Vehicle CollaborativeLearning for Trajectory Prediction with Spatio-Temporal Tensor Fusion,” IEEETransactions on Intelligent Transportation Systems, vol. 23, no. 1, pp.236-248, 2022, doi: 10.1109/TITS.2020.3009762. (IEEE 汇刊、中科院一区)
6. Yu Wang and ShengjieZhao, “Weakly-Supervised Action Localization by Hierarchical AttentionMechanism with Multi-Scale Fusion Strategies”, in Proceedings of the IEEEInternational Conference on Multimedia and Expo (ICME), 2024, pp. 1-6, doi:10.1109/ICME57554.2024.10688175. (CCF B类)
7. Yu Wang and ShengjieZhao, “Consistent Representation Learning Across Modalities for Zero-Shot ImageRecognition,” in Proceedings of the IEEE International Conference onMultimedia and Expo (ICME), 2021, pp. 1-6, doi:10.1109/ICME51207.2021.9428172. (CCF B类)
8. Yu Wang and ShengjieZhao, “Cross-Modal Representation Reconstruction for Zero-Shot Classification,”in Proceedings of the IEEE International Conference on Acoustics, Speech andSignal Processing (ICASSP), 2021, pp. 2820-2824, doi:10.1109/ICASSP39728.2021.9413572. (CCF B类)
9. Lele Xie, ZumingHuang, Boqian Xia, Yu Wang, Yadong Li, Hongbin Wang and Jingdong Chen,ICDAR 2023 Competition on Structured Text Extraction from Visually-RichDocument Images—E2E Complex Entity Linking, Winning Team,2023.(结构化文本提取挑战赛-端到端复杂实体链接赛道冠军)
国家技术发明专利:
1. 赵生捷;汪昱;张林;一种基于分层条件生成对抗网络的水下图像复原方法,2024.04.26,中国,ZL202110916857.8.
2. 赵生捷;汪昱;张林;一种面向海洋生物的轻量化混叠稠密网络分类方法和系统,2024.03.29,中国,ZL202110916982.9.
3. 汪昱;赵生捷;一种基于语义查询学习的点监督视频动作定位方法,2024.08.20,中国,CN202411144207.6.
4. 汪昱;赵生捷;一种基于对偶时序图的跨模态视频片段检索方法,2024.10.25,中国,CN202411497553.2.
担任以下国际顶级期刊和会议审稿人:
IEEE Transactions on Multimedia
IEEE Transactions on Circuits and Systems for Video Technology
IEEE Transactions on Intelligent Transportation Systems
IEEE Transactions on Vehicular Technology
IEEE Conference on Computer Vision and Pattern Recognition
International Conference on Learning Representations
IEEE International Conference on Acoustics, Speech, and Signal Processing
IEEE International Conference on Multimedia and Expo
International Conference on Pattern Recognition

文件上传中...