Mind the Modality Gap: Towards a Remote Sensing Vision-Language Model via Cross-modal Alignment

Pretrained models

The weights of both aligned and patched models can be accessed using the following links:

Citation

If you use this work please cite:

@misc{zavras2024mindmodalitygapremote,
      title={Mind the Modality Gap: Towards a Remote Sensing Vision-Language Model via Cross-modal Alignment}, 
      author={Angelos Zavras and Dimitrios Michail and Begüm Demir and Ioannis Papoutsis},
      year={2024},
      eprint={2402.09816},
      archivePrefix={arXiv},
      primaryClass={cs.CV},
      url={https://arxiv.org/abs/2402.09816}, 
}

Name		Name	Last commit message	Last commit date
Latest commit History 4 Commits
conf		conf
README.md		README.md
agents.py		agents.py
data.py		data.py
heads.py		heads.py
main.py		main.py
models.py		models.py
transforms.py		transforms.py
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Mind the Modality Gap: Towards a Remote Sensing Vision-Language Model via Cross-modal Alignment

Pretrained models

Citation

About

Releases

Packages

Languages

Orion-AI-Lab/MindTheModalityGap

Folders and files

Latest commit

History

Repository files navigation

Mind the Modality Gap: Towards a Remote Sensing Vision-Language Model via Cross-modal Alignment

Pretrained models

Citation

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages