iioos
/

multimodal-caption-model

Create README.md

b2bb309 verified 2 months ago

183 Bytes

language: en
license: mit
tags:
  - multimodal
  - vision-language
  - captioning

Multimodal Caption Model

A model designed to generate textual descriptions from visual inputs.