画像生成AIに2度目の革命を起こした「ControlNet」

2023年05月22日 09時00分更新

文● 新清士　編集●ASCII

筆者作成

　画像生成AI「StableDiffusion」の進化が止まりません。昨年8月にオープンソースとしてリリースされてから、世界中のプロアマ問わず多数の人たちが様々な研究成果を反映させ、毎日と言っていいほど新機能を誰かが発表するという状況が起きています。

　StableDiffusion登場当初は、画像の品質のランダム性が高く、構図やポーズなどを指定できないという弱点を抱えていました。1枚の画像をもとに画像を生成する「i2i（image2image）」である程度コントロールすることはできても、「キャラクターに特定のポーズをとらせる」といったことは非常に難しかったんですね。

　その状況を一変させる新機能が今年2月に登場しました。その名も「ControlNet」。プロンプトによる制約を克服するための、とてつもないポテンシャルを持つ技術でした。Stable Diffusionに次ぐ「2度目の炸裂」と言っていいほど、生成AIのあり方を変えてしまいました。

　ControlNetを発表したのは、ハンドルネームlllyasviel、チャン・リュミンさんという研究者です。2月に関連論文を発表した後、2週間程度でStable Diffusionの制作環境「A1111 Web UI」の拡張機能に組み込まれてきたので、世界中が驚きました。論文発表後、これだけの早さで機能が実装されるというのは非常に珍しいことです。特に企業の場合、チェックプロセスなど様々な工程があるため、発表から1年程度待たされるのは当たり前のことでした。

ControlNetの開発者のチャン・リュミンさん（チャンさんの公式ページより）

　チャンさんはもともと香港中文大学で、白黒のイラストに着彩するAI技術「Style2Paints」を研究されていた方です。この研究は日本でもずいぶんと話題になりました。現在は、2022年にシリコンバレーの中心地にある米スタンフォード大学の博士課程に進み、画像生成AIの研究室に所属しているようです。

日本でも2018年に話題になった「Style2Paints」を使った実際の着彩例。lllyasviel氏の過去の研究を紹介するページから

前へ 1 2 3 4 次へ

ツイートする

カテゴリートップへ

画像生成AIに2度目の革命を起こした「ControlNet」

この連載の記事

この記事の編集者は以下の記事をオススメしています

トピックス 赤松健氏「画像生成AI、珍しく日本が勝つチャンス」

トピックス AIの著作権問題が複雑化

AI ChatGPT（GPT-4）がすごすぎる シンギュラリティも近い？

AI ChatGPTは人類を滅ぼす「超知能」になるのか?

トピックス メタバース化したFortniteがすごすぎる

VR メタ「Quest 3」自分たちの生死をかけた大勝負

トピックス 読める、読めるぞ！ 画像生成AIで作ったイラストQRコードが話題

AI Photoshopの画像生成AIがすごい ついに商用利用もスタートへ

ビジネス 生成AIで映像制作はどう変わる？／「脳インプラント除去」は人権侵害か

ビジネス AIが発見した高速アルゴリズム／チャットGPTを支える「時給2ドル未満」の仕事

sponsored 画像生成AI「Stable Diffusion」も爆速 最新Ryzenマシンがすごかった

AI 生成AIでゲーム開発、2024年発売へ AIベンチャーが資金調達

AI 文化庁、話題の「AIと著作権」セミナーをYouTubeでアーカイブ配信

AI 集英社も取り下げた「AIグラビア」の問題点

ビジネス チャットGPTの成功を支える低賃金労働者／米国でヒートポンプ本格普及の兆し

ビジネス グーグルがAI生成画像に電子透かし／「感情認識AI」 なぜ規制？

AI 画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」

AI お絵描きタイムラプス風の動画が生成できるAI「Paints-UNDO」登場

AIオススメ記事

ピックアップ

トピックス
赤松健氏「画像生成AI、珍しく日本が勝つチャンス」

トピックス
AIの著作権問題が複雑化

AI
ChatGPT（GPT-4）がすごすぎる　シンギュラリティも近い？

AI
ChatGPTは人類を滅ぼす「超知能」になるのか?

トピックス
メタバース化したFortniteがすごすぎる

VR
メタ「Quest 3」自分たちの生死をかけた大勝負

トピックス
読める、読めるぞ！画像生成AIで作ったイラストQRコードが話題

AI
Photoshopの画像生成AIがすごい　ついに商用利用もスタートへ

ビジネス
生成AIで映像制作はどう変わる？／「脳インプラント除去」は人権侵害か

ビジネス
AIが発見した高速アルゴリズム／チャットGPTを支える「時給2ドル未満」の仕事

sponsored
画像生成AI「Stable Diffusion」も爆速　最新Ryzenマシンがすごかった

AI
生成AIでゲーム開発、2024年発売へ　AIベンチャーが資金調達

AI
文化庁、話題の「AIと著作権」セミナーをYouTubeでアーカイブ配信

AI
集英社も取り下げた「AIグラビア」の問題点

ビジネス
チャットGPTの成功を支える低賃金労働者／米国でヒートポンプ本格普及の兆し

ビジネス
グーグルがAI生成画像に電子透かし／「感情認識AI」なぜ規制？

AI
画像生成AIに“照明”革命　ControlNet開発者が作った「IC-Light」

AI
お絵描きタイムラプス風の動画が生成できるAI「Paints-UNDO」登場