グーグルは3月12日、最新の大規模言語モデル(LLM)「Gemini 2.0 Flash Experimental」の画像生成・編集機能を「Google AI Studio」で開発者向けに試験的に無料公開した。
Stability AIの「Stable Diffusion」やグーグルの「Imagen 3」といった従来の画像生成特化モデルとは異なり、Gemini 2.0 Flash Experimentalはテキスト生成と画像生成を単一のモデルで実行する「マルチモーダルネイティブ」であることが大きな特徴だ。これにより、視点変更、キャラクターの一貫性維持、精度の高いテキスト描画など、従来の画像生成AIが苦手としていた作業も可能となった。特に、これまで画像生成AIを利用してきたユーザーほど、その進化を実感できるだろう。
具体的な作例を交えながら、Gemini 2.0 Flash Experimentalの「どこがすごいのか」を解説していきたい。
この連載の記事
-
第26回
AI
人気の画像生成AIツール「ComfyUI」デスクトップアプリがめっちゃラク 初心者にオススメ -
第25回
AI
業界トップ級の画像生成AIツール「Recraft」 Adobeユーザーは体験する価値あり -
第24回
AI
SD3.0の汚名返上なるか?!画像生成AI「Stable Diffusion 3.5」を試してみた -
第23回
AI
最新の画像生成AI「FLUX1.1 [pro]」違いは? Midjourney、DALL-E、Imagen 3、Stable Image Ultraと比較 -
第22回
AI
画像生成AI「Midjourney」の使い方 Webアプリ版の画像編集機能を完全マスター -
第21回
AI
画像生成AI「Midjourney」の使い方 待望のWebアプリ版を徹底的に解説します -
第20回
AI
話題の画像生成AI「FLUX.1」をStable Diffusion用の「WebUI Forge」で動かす(高速化も試してみました) -
第19回
AI
画像生成AI「Stable Diffusion」の代替に? 話題の「FLUX.1」を試した -
第18回
AI
イラストを完成させる動画はAIで作れるのか「Paints-Undo」試してみた -
第17回
AI
人気の画像生成AI、違いは? Stable Diffusion XL、Midjourney、DALL-E、Playgroundの画風を比較する - この連載の一覧へ