シリーズ目次

stable-diffusion-survey

Stable Diffusion関連の論文解説記事のリンク集。画像生成・動画生成の基礎モデルから応用技術まで論文ベースで解説。

12 記事

シリーズ記事一覧

シリーズ
AI & Creativity
8分で読了

【Stable Diffusion】画像生成モデルの仕組みを理解する

Series: stable-diffusion-survey

この記事では、Stable Diffusionの画像生成モデルの仕組みを解説します。拡散モデルの基本概念からLatent Diffusion Models(LDM)の詳細まで、理論的背景と具体的なプロセスを説明。なんとなくで使ってるその技術、どうやって動いてるか知りたくないですか?

シリーズ
AI & Creativity
9分で読了

Stable Diffusion 3論文読み:ついにUNetを卒業したようです

Series: stable-diffusion-survey

Stable Diffusion 3は、CLIPとT5を組み合わせた新しいText Encoderや、DiTアーキテクチャの導入で大幅に進化しました。新しいノイズスケジューラーにより、生成性能が向上し、txt2imgで最先端モデルを超える性能を実現。簡単に論文の内容を説明します。

シリーズ
AI & Creativity
8分で読了

LoRA(Low-Rank Adaptation)とは?大規模モデルを低コストでファインチューニングする手法とメリット

Series: stable-diffusion-survey

機械学習や画像生成AIで注目を集める「LoRA」の仕組みを初心者向けに解説。巨大なTransformerモデルの重みを固定し、低ランク行列を追加することで計算コストやメモリを使わずに効率的にファインチューニングする手法やメリットを紹介します。

シリーズ
AI & Creativity
5分で読了

IPAdapterの簡単解説:画像をプロンプトとして使用できる!?【Stable Diffusion】

Series: stable-diffusion-survey

IPAdapterは、既存のStable Diffusionモデルに画像プロンプト機能を追加し、計算コストを抑えながらも画像のスタイルを維持した画像生成を実現します。この記事では、そのアーキテクチャやメリット、評価結果について簡潔に解説します。

シリーズ
AI & Creativity
4分で読了

動画のフレームレートを上げる技術:RIFEとそのアーキテクチャ

Series: stable-diffusion-survey

ディープラーニングを用いた動画のフレーム補間技術「RIFE」のアーキテクチャを解説。高精度のオプティカルフロー推定を実現する「IFNet」の仕組みや、モデルサイズを抑えつつ精度を高める「特権蒸留(Privileged Distillation)」の手法について、論文の内容をもとに分かりやすく紹介します。