Lab811

Lab811

Popular repositories Loading

mmf mmf Public

Forked from facebookresearch/mmf

A modular framework for vision & language multimodal research from Facebook AI Research (FAIR)

Python
awesome-vision-language-pretraining-papers awesome-vision-language-pretraining-papers Public

Forked from yuewang-cuhk/awesome-vision-language-pretraining-papers

Recent Advances in Vision and Language PreTrained Models (VL-PTMs)
xmodaler xmodaler Public

Forked from YehLi/xmodaler

X-modaler is a versatile and high-performance codebase for cross-modal analytics(e.g., image captioning, video captioning, vision-language pre-training, visual question answering, visual commonsens…

Python
WuDaoMM WuDaoMM Public

WuDaoMM data downloads

Python
WuDaoMM-1 WuDaoMM-1 Public

Forked from BAAI-WuDao/WuDaoMM

WuDaoMM this is a data project

Python