Publications

12 results at CVPR 2024

PhysPT: Physics-aware Pretrained Transformer for Estimating Human Dynamics from Monocular Videos
- - Yufei Zhang
  - Jeff Kephart
  - et al.
- 2024
- CVPR 2024
Interactive Image Segmentation Guided by Visual Prompting
- - Thomas Frick
  - Cezary Skura
  - et al.
- 2024
- CVPR 2024
QAttn: Efficient GPU Kernels for mixed-precision vision transformers
- - Piotr Sebastian Kluska
  - Adrián Castelló
  - et al.
- 2024
- CVPR 2024
Machine Unlearning in Computer Vision: Foundations and Applications
- - Sijia Liu
  - Yang Liu
  - et al.
- 2024
- CVPR 2024
Grounding Everything: Emerging Localization Properties in Vision-Language Transformers
- - Walid Bousselham
  - Felix Petersen
  - et al.
- 2024
- CVPR 2024
Open3DIS Open-Vocabulary 3D Instance Segmentation with 2D Mask Guidance
- - Phuc Nguyen
  - Tuan Duc Ngo
  - et al.
- 2024
- CVPR 2024
SOK-Bench: A Situated Video Reasoning Benchmark with Aligned Open-World Knowledge
- - Andong Wang
  - Bo Wu
  - et al.
- 2024
- CVPR 2024
What When and Where? Self-Supervised Spatio Temporal Grounding in Untrimmed Multi-Action Videos from Narrated Instructions
- - Brian Chen
  - Nina Shvetsova
  - et al.
- 2024
- CVPR 2024
Overload: Latency Attacks on Object Detection for Edge Devices
- - Erh-Chung Chen
  - Pin-Yu Chen
  - et al.
- 2024
- CVPR 2024
MultiPLY: A Multisensory Object-Centric Embodied Large Language Model in 3D World
- - Yining Hong
  - Zishuo Zheng
  - et al.
- 2024
- CVPR 2024