VLM | AIエンジニアになるには

【2025】「VLMとは？」LLM時代に注目の“視覚と言葉をつなぐAI”

VLM（視覚言語モデル）は、画像や動画とテキストを同時に理解するAIです。写真の説明生成や画像検索、Q&Aが可能で、ゼロショット学習で未知の対象にも対応しています。ローカル運用も進み、注目されている分野です。ここではVMLの基礎を説明します。

2025.07.29

AIVLM大規模言語モデル生成AI