LMM将成为下一个竞争的热土
(large multimodal model, 多模态大模型)。
总结下有哪些进展:
🤖 LLaVa: 开源的GPT4-V的竞争者
🔗 识别图片的Langchain: 图片上的RAG
🚀 MiniGPT-v2: 视觉-语言混合的任务
🎨 SEED-LLaMA: 模拟人类的看、读和想象

AI news tracing site
(large multimodal model, 多模态大模型)。
🤖 LLaVa: 开源的GPT4-V的竞争者
🔗 识别图片的Langchain: 图片上的RAG
🚀 MiniGPT-v2: 视觉-语言混合的任务
🎨 SEED-LLaMA: 模拟人类的看、读和想象