VLM

AI

【2025】「VLMとは?」LLM時代に注目の“視覚と言葉をつなぐAI”

VLM(視覚言語モデル)は、画像や動画とテキストを同時に理解するAIです。写真の説明生成や画像検索、Q&Aが可能で、ゼロショット学習で未知の対象にも対応しています。ローカル運用も進み、注目されている分野です。ここではVMLの基礎を説明します。