AI 【2025】「VLMとは?」LLM時代に注目の“視覚と言葉をつなぐAI” VLM(視覚言語モデル)は、画像や動画とテキストを同時に理解するAIです。写真の説明生成や画像検索、Q&Aが可能で、ゼロショット学習で未知の対象にも対応しています。ローカル運用も進み、注目されている分野です。ここではVMLの基礎を説明します。 2025.07.29 AIVLM大規模言語モデル生成AI