杨森 | 计算机视觉研究员

太长不看（预览图）

# **杨森个人主页**
## 关于我
- **计算机视觉研究员**
- 研究方向：
  - 计算机视觉
  - 多模态大语言模型
  - 自动驾驶
## 教育背景
- **博士**：东南大学（2019.5-2023.3）
- 硕士：东南大学（2017.9-2019.1）
- 学士：吉林大学（2013.9-2017.7）
## 工作经历
- **百度 VIS 高级研发工程师**（2023.7-至今）
- 腾讯 TPG 实习生（2021.12-2022.8）
- 旷视科技 实习生（2021.1-2021.10）
## 研究成果
- **自动驾驶**
  - TopoSD: Topology-Enhanced Lane Segment Perception
  - MGMapNet: Multi-Granularity Representation Learning
- **多模态大模型**
  - Vision Remember: Alleviating Visual Forgetting in Efficient MLLM
- **姿态估计**
  - Detecting and grouping keypoints
  - Capturing the motion of every joint
  - Searching part-specific neural fabrics
  - SimCC: A Simple Coordinate Classification
  - TokenPose: Learning Keypoint Tokens
  - TransPose: Keypoint Localization via Transformer
## 技术栈
- **多模态大模型**
  - MLLM架构：自回归模型、LLaVA、Qwen2.5-VL、LISA、Grounding Models
  - 训练技术：SFT、强化学习
  - 视觉Token压缩、大规模分布式训练
- **自动驾驶感知**
  - BEV视觉建图、时序建模、概率规划
  - 多模态融合：视觉+地图结构化数据
  - VLM
- **深度学习框架**
  - PyTorch、Python、C++
  - Transformer模型、GPU/昇腾NPU开发
## 联系方式
- 邮箱: yangsenius@gmail.com
- 博客: senyang-ml.github.io
- 谷歌学术主页

提示：可自由拖动查看思维导图内容

工作实习经历

百度 VIS

高级研发工程师

2023.7 - 至今

负责多模态大模型、自动驾驶视觉感知与规划的算法研究与创新应用，旨在推动技术边界，解决复杂挑战。工作涵盖从前沿算法设计到产品落地的全流程，注重将理论突破转化为实际业务价值，并在多个核心领域取得显著进展。

腾讯 TPG

实习生

2021.12 - 2022.8

负责三维人体重建与动作生成项目，基于参数化SMPL模型提出独立token表征方法，实现了高精度的三维人体重建和关节运动捕捉，3DPW指标提升8%，论文发表在ICLR-2023 (spotlight, top25%)。

旷视科技

实习生

2021.1 - 2021.10

参与人体姿态估计项目，设计基于token表示的Transformer模型（ICCV-2021）。研究Transformer中注意力模式（Pattern Recognition）。首创坐标分类新范式SimCC，突破传统回归和heatmap方法精度瓶颈（ECCV 2022 Oral，被主流姿态估计框架采用）。

研究成果

TopoSD: Topology-Enhanced Lane Segment Perception with SDMap Prior

Sen Yang, Minyue Jiang, Ziwei Fan, Xiaolu Xie, Xiao Tan, Yingying Li, Errui Ding, Liang Wang, Jingdong Wang.

2024 预印本 (引用1次)

论文

HisTrackMap: Global Vectorized High-Definition Map Construction via History Map Tracking

Jing Yang*, Sen Yang*, Xiao Tan, Hanli Wang.

arXiv preprint arXiv:2503.07168, 2025

论文

MGMapNet: Multi-Granularity Representation Learning for End-to-End Vectorized HD Map Construction

Jing Yang*, Minyue Jiang*, Sen Yang*, Xiao Tan, Yingying Li, Errui Ding, Hanli Wang, Jingdong Wang.

ICLR 2025 (引用0次)

PDF

Adnet: Lane shape prediction via anchor decomposition

L Xiao, X Li, S Yang, W Yang.

ICCV 2023 (引用24次)

论文

Detecting and grouping keypoints for multi-person pose estimation using instance-aware attention

Sen Yang, Ze Feng, Zhicheng Wang, Yanjie Li, Shoukui Zhang, Zhibin Quan, Shu-tao Xia, Wankou Yang.

Pattern Recognition (引用22次)

期刊论文

Capturing the motion of every joint: 3D human pose and mesh recovery with independent tokens

Sen Yang, Wen Heng, Gang Liu, Guozhong Luo, Wankou Yang, Gang Yu.

ICLR 2023 (spotlight, top 25%) (引用14次)

论文代码项目

Searching part-specific neural fabrics for human pose estimation

Sen Yang, Wankou Yang, Zhen Cui.

Pattern Recognition (引用12次)

期刊论文代码

SimCC: A Simple Coordinate Classification perspective for human pose estimation

Yanjie Li, Sen Yang, Peidong Liu, Shoukui Zhang, Yunxiao Wang, Zhicheng Wang, Wankou Yang, Shu-Tao Xia.

ECCV 2022 (oral, top 5%) (引用200+次)

论文代码知乎

TokenPose: Learning Keypoint Tokens for Human Pose Estimation

Yanjie Li, Shoukui Zhang, Zhicheng Wang, Sen Yang, Wankou Yang, Shu-Tao Xia, Erjin Zhou.

ICCV 2021 (引用400+次)

论文代码

TransPose: Keypoint Localization via Transformer

Sen Yang, Zhibin Quan, Mu Nie, Wankou Yang.

ICCV 2021 (引用500+次)