Aligning Vision Language Models via anchor

Yilin Yang, Yuke Wang, Rabimba Karanjai, Weidong Shi, Chengming Zhang Jan 1, 2026

Read Paper

Paper coming soon. Check back or search on Google Scholar.

Preprint: Aligning visual tokens with semantic text anchors to enhance multi-modal reasoning capabilities.

Type Preprint

Venue NeurIPS 2026 (Under Review)

Date Jan 2026

Computer Vision Multi-Modal AI Alignment