跨模态检索(Cross-Modal Retr […]
跨模态嵌入是一种将不同模态的数据(如文本、图 […]
图像到文本生成(Image-to-Text […]
多模态提示(Multimodal Promp […]