Animelike25D : セルルックモデル

少し前に話題になった実写動画からアニメーションをつくりだすデモンストレーション作品で使用されたのがAnimelike25Dです。

かなり特徴的なモデルです。アニメ調のセルルック画像を生成します。そのタッチは現代的な2Dアニメの特徴をよく備えています。
生成画像の見た目だけでなく、生成自体が特徴的です。通常のモデルは、CFGやSTEPによって画像内容が大きく変化します。Animelike25Dは、CFG、STEPを変えても大きく変化しません。振り幅が非常に狭いのが特徴です。

モデルは、haggingfaceで配布されています。

https://huggingface.co/stb/animelike2d/tree/main

vaeが別途必要です。作例では定番のkl-f8-anime2.ckptを使用しています。

https://huggingface.co/hakurei/waifu-diffusion-v1-4/tree/main/vae

((masterpiece,best quality)), Depth of field, (bokeh), cityscape, 2girls, happy, highschool uniform, jacket, looking at viewer, dutch angle
Negative prompt: EasyNegative, signature, watermark, username, blush, plush toy, torii, bad finger, few fingers, bad hands, kimono
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 1909927064, Size: 768x512, Model hash: 4f24a26d75

はい、ご覧の通りセルルックです。このモデルは、ディティール、構図も振り幅が小さくなっています。Promptの拘束力が強いので、できるだけ具体的なイメージになるようキーワードを設定します。

((masterpiece,best quality)), Depth of field, (bokeh), cityscape, 2girls, happy, highschool uniform, jacket, looking at viewer, dutch angle
Negative prompt: EasyNegative, signature, watermark, username, blush, plush toy, torii, bad finger, few fingers, bad hands, kimono
Steps: 20, Sampler: DPM++ 2M Karras, CFG scale: 7, Seed: 3822677831, Size: 512x768, Model hash: 4f24a26d75

振り幅が小さいため、条件が整えば同系統の画像が生成されます。この特徴は、動画作成で有効です。ControlNetを利用して、実写画像(または原画+動画)から特徴を抽出、それをもとにセルルック画像を生成します。通常のモデルは、生成時に振り幅が大きいため、フレームによって、髪型や服、色などにばらつきが生じます。振り幅が小さいと、このフレームごとのイメージのブレが小さくなります。特定の条件を備えた実写もしくは、原画+動画が必要になりますが、アニメぽいものをつくるひとつの手段になります。(現状、それぽいものができるだけです。)

カテゴリー: AIキャラクター, AI技術情報 パーマリンク