image-text-matching

Star

Here are 30 public repositories matching this topic...

NVlabs / GroupViT

Star

Official PyTorch implementation of GroupViT: Semantic Segmentation Emerges from Text Supervision, CVPR 2022.

transformers semantic-segmentation zero-shot-learning image-text-matching

Updated May 10, 2022
Python

Paranioar / Awesome_Matching_Pretraining_Transfering

Star

The Paper List of Large Multi-Modality Model, Parameter-Efficient Finetuning, Vision-Language Pretraining, Conventional Image-Text Matching for Preliminary Insight.

tutorial awesome-list vision-and-language video-text-recognition cross-modal-retrieval visual-semantic-embedding image-text-matching video-text-retrieval image-text-retrieval multimodal-pretraining large-language-models large-vision-language-models multimodal-large-language-models memory-efficient-tuning parameter-efficient-fine-tuning large-vision-models

Updated Jul 11, 2024

slavabarkov / tidy

Star

Offline semantic Text-to-Image and Image-to-Image search on Android powered by quantized state-of-the-art vision-language pretrained CLIP model and ONNX Runtime inference engine

android kotlin nlp computer-vision deep-learning image-search quantization clip semantic-search image-retrieval onnx cross-modal-retrieval image-text-matching image-text-retrieval

Updated Mar 28, 2024
Kotlin

Paranioar / SGRAF

Star

[AAAI2021] The code of “Similarity Reasoning and Filtration for Image-Text Matching”

image-retrieval aaai text-matching similarity-metric cross-modal-retrieval image-text-matching image-text-retrieval

Updated Apr 11, 2024
Python

woodfrog / vse_infty

Star

Code for "Learning the Best Pooling Strategy for Visual Semantic Embedding", CVPR 2021 (Oral)

pytorch vse visual-semantic vision-language cross-modal-retrieval image-text-matching

Updated Feb 20, 2023
Python

kywen1119 / DSRAN

Star

Code for journal paper "Learning Dual Semantic Relations with Graph Attention for Image-Text Matching", TCSVT, 2020.

computer-vision pytorch cross-modal tcsvt image-text-matching

Updated Oct 25, 2022
Python

naver-ai / eccv-caption

Star

Extended COCO Validation (ECCV) Caption dataset (ECCV 2022)

machine-learning deep-learning evaluation dataset vision-and-language cross-modal-retrieval image-text-matching eccv2022 vl-benchmark

Updated Mar 1, 2024
Python

weiyx16 / CLIP-pytorch

Star

A non-JIT version implementation / replication of CLIP of OpenAI in pytorch

pytorch clip image-text-matching

Updated Jan 15, 2021
Python

eric-ai-lab / ComCLIP

Star

Official implementation and dataset for the NAACL 2024 paper "ComCLIP: Training-Free Compositional Image and Text Matching"

causality clip svo slip vision-and-language compositionality flickr8k-dataset image-text-matching flickr30k image-text-retrieval winoground blip2

Updated Aug 18, 2024
Python

Paranioar / RCAR

Star

[TIP2023] The code of “Plug-and-Play Regulators for Image-Text Matching”

tip image-retrieval text-matching regulator cross-modal-retrieval image-text-matching image-text-retrieval

Updated Apr 11, 2024
Python

MartinYuanNJU / SEMScene

Star

Code implementation of paper "SEMScene: Semantic-Consistency Enhanced Multi-Level Scene Graph Matching for Image-Text Retrieval" (ACM TOMM 2024).

cross-modal-retrieval scene-graph-models image-text-matching

Updated Sep 20, 2024
Python

jaisidhsingh / CoN-CLIP

Star

Implementation of the "Learn No to Say Yes Better" paper.

deep-learning pytorch multimodal compositionality image-captions image-text-matching visual-language-models

Updated Nov 2, 2024
Python

jaisidhsingh / LoRA-CLIP

Star

Easy wrapper for inserting LoRA layers in CLIP.

lora multimodal multimodal-deep-learning image-text-matching parameter-efficient-tuning vision-language-pretraining low-rank-adaptation

Updated Jun 16, 2024
Python

nhtlongcs / AIC2022-VER

Star

Text Query based Traffic Video Event Retrieval with Global-Local Fusion Embedding

retrieval pytorch aicitychallenge pytorch-lightning image-text-matching

Updated Aug 2, 2023
Python

zabir-nabil / bangla-image-search

Star

A dead-simple image search and image-text matching system for Bangla using CLIP

search search-engine deep-learning image-search clip image-retrieval image-search-engine image-text-matching openai-clip contrastive-language-image-pre-training bangla-clip-search clip-image-search-engine deep-learning-image-search

Updated Jun 27, 2023
Python

JinhaoLee / WCA

Star

[ICML 2024] Visual-Text Cross Alignment: Refining the Similarity Score in Vision-Language Models

deep-learning similarity-score image-text-matching zero-shot-classification large-language-models visual-prompting vision-language-model visual-text-alignment textual-prompting

Updated Sep 3, 2024
Python

alipay / PC2-NoiseofWeb

Star

Noise of Web (NoW) is a challenging noisy correspondence learning (NCL) benchmark containing 100K image-text pairs for robust image-text matching/retrieval models.

benchmark dataset captioning-images multimodal-learning cross-modal-retrieval acmmm image-text-matching image-text-retrieval noisy-correspondence acmmm2024

Updated Sep 5, 2024
Python

zabir-nabil / bangla-CLIP

Star

CLIP (Contrastive Language–Image Pre-training) for Bangla.

clip image-retrieval image-text-matching openai-clip contrastive-language-image-pre-training clip-image-search-engine bangla-image-search bangla-image-retrieval

Updated Jul 13, 2024
Python

cuiaiyu / Text-to-Image-ReIdentification

Star

Unofficial code of paper "Improving description-based person re-identification by multi-granularity image-text alignment." by Niu et al. (partially implemented)

pytorch re-identification image-text-matching

Updated Jan 8, 2023
Jupyter Notebook

marialymperaiou / knowledge-enhanced-multimodal-learning

Star

A list of research papers on knowledge-enhanced multimodal learning

knowledge-graph multi-task-learning visual-reasoning visual-dialog visual-question-answering vision-and-language multimodal-deep-learning visual-storytelling multimodal-retrieval visual-grounding visual-commonsense-reasoning vision-and-language-navigation story-visualization image-text-matching vision-language-transformer image-text-retrieval vision-and-language-pre-training conditional-image-generation knowledge-enhanced-multimodal-learning knowledge-enhanced-vision-language

Updated Dec 8, 2022

Improve this page

Add a description, image, and links to the image-text-matching topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the image-text-matching topic, visit your repo's landing page and select "manage topics."

Learn more

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

image-text-matching

Here are 30 public repositories matching this topic...

NVlabs / GroupViT

Paranioar / Awesome_Matching_Pretraining_Transfering

slavabarkov / tidy

Paranioar / SGRAF

woodfrog / vse_infty

kywen1119 / DSRAN

naver-ai / eccv-caption

weiyx16 / CLIP-pytorch

eric-ai-lab / ComCLIP

Paranioar / RCAR

MartinYuanNJU / SEMScene

jaisidhsingh / CoN-CLIP

jaisidhsingh / LoRA-CLIP

nhtlongcs / AIC2022-VER

zabir-nabil / bangla-image-search

JinhaoLee / WCA

alipay / PC2-NoiseofWeb

zabir-nabil / bangla-CLIP

cuiaiyu / Text-to-Image-ReIdentification

marialymperaiou / knowledge-enhanced-multimodal-learning

Improve this page

Add this topic to your repo