VRAM6GBでも動く!動画生成AI「FramePack」のデモを試してみた
「FramePack」はVRAM使用量を大幅に削減した動画生成AIモデルです。本記事ではRTX3050(8GB)を用いて実際に公式デモを試し、動作環境やセットアップ方法、生成品質について詳しく解説します。動画生成の軽量化に興味がある方必見です。
15 記事
「FramePack」はVRAM使用量を大幅に削減した動画生成AIモデルです。本記事ではRTX3050(8GB)を用いて実際に公式デモを試し、動作環境やセットアップ方法、生成品質について詳しく解説します。動画生成の軽量化に興味がある方必見です。
画像生成AI「Stable Diffusion」における代表的な3つのimage2image手法(Latent Image、ControlNet、IPAdapter)の特徴を徹底比較。各アプローチの仕組みやワークフロー構成、生成結果の違い、メリット・デメリットを初心者向けに解説します。
ComfyUIでRIFE(Frame Interpolation)を活用し、動画のフレームレートを滑らかに向上させる手順を徹底解説。カクつきを抑えた高品質な動画生成のためのワークフロー構築方法と、実際の比較結果を紹介します。
画像生成AIでよくある顔崩れを自動解決する「Face Detailer」を解説。Stable DiffusionのGUI環境「ComfyUI」と専用拡張機能を使い、画像生成後のワークフローに組み込んで顔の手直しを簡単に行う手順と生成結果を紹介します。
無料のペイントソフト Krita と Stable Diffusion 拡張(krita-ai-diffusion)を組み合わせ、落書きからAI画像をリアルタイム生成する手順を解説!プラグインの導入からサーバー設定、Live Preview機能を使った直感的な画像生成方法まで初心者向けにガイドします。
画像生成AI環境「ComfyUI」を使って動画から動画を生成する「Vid2Vid」のやり方を解説。AnimateDiffやControlNet等を組み合わせ、指定した顔の特徴を維持したまま高精度に動画変換する手順や生成結果を紹介します。
Stable Diffusion 3は、CLIPとT5を組み合わせた新しいText Encoderや、DiTアーキテクチャの導入で大幅に進化しました。新しいノイズスケジューラーにより、生成性能が向上し、txt2imgで最先端モデルを超える性能を実現。簡単に論文の内容を説明します。
Stable Audio Openが無償公開され、ローカル環境で高品質なAI楽曲生成が可能になりました。この記事では、Stability AIのリポジトリを使用した公式デモの構築手順や、実際に生成した音源サンプルを紹介します。
ComfyUIでESRGANを使用して、画像生成AIの出力を高画質化・アップスケールする手順を解説します。Hires.fixとの違いや、おすすめのモデル(4x-Ultrasharp等)の導入方法についてエンジニア目線で深掘りします。
ComfyUIを使ったStableDiffusionによるInpaint技術の手順を詳しく解説。画像の特定部分をマスクし、新たな要素を追加する方法をステップバイステップで説明します。生成結果も掲載しています。
この記事では、ComfyUIを使って、Stable DiffusionのOutpaintを行う手順を紹介します。Outpaintを使用することで、自分で描かずとも、画像の外側に新しい内容を追加することができます。
ComfyUIを使ってStable Diffusionでembeddingを使用する方法を紹介します。好きなembeddingを使用した実例とその効果の違いを画像で比較し、より良い生成結果を得るためのポイントも解説します。