AIイラスト用語辞典

AIイラストを語る上で重要な用語をまとめています。
個人で編集しているため、誤った知識、抜けている情報等がある可能性があります。
AIイラストのみでなく周辺のAI事情も多少汲んでいますが、間違った見解が多い可能性があります。
法律にも多少触れていますが、法律は全くの門外漢なので、法律関係はかならず弁護士などに相談してください。

a~g

Adobe Firefly

アドビファイヤーフライ

Adobeが作った画像生成AI
Adobeは、画像編集ソフトであるPhotoshopを始めクリエイターのための制作ソフトを制作、販売している企業である。
Fireflyは2023年3月21日にベータ版をリリースした。

Adobe Stockを利用したクリーンなデーターベースと、学習元データに利益が還元されるシステムを売りにしている。

しかしAdobe Stockが著作権違反のコンテンツの排除をこなせていないという指摘もあり、本当にクリーンなのか様子を見る動きもある。

chatGPT

チャットGPT

人間の使う言語を学習した言語モデル。
OpenAIによって開発された。

会話だけでなく、プログラミング、コーディングも可能。
画像生成は直接はできないが、画像生成AIに絵を描かせるプロンプトを生成した事例がいくつかある。

2022年11月30日に公開されたGPT-3.5が最初にChatGPTと呼ばれたもので、2023年3月14日に後継となるGPT-4が発表された。

ControlNet

コントロールネット

Stable Diffusion WebUIの拡張機能の一つ。
2023年2月10日から提供が始まった。
モデルを高度にコントロールすることで、それまで難しかったポーズなどの指定を簡単にした。
これによって狙った品質のものが出しやすくなり、選別の手間が激減した。

ControlNetでは、お手本となる写真やイラストからポーズを取り出すことができる。
これは狭義のImg to Imgには当たらないが、設定によってはそれよりも遙かに類似した画像を生成できる。
また広義にはImg to Imgと取ることもできる。

DALL-E

ダリ

OpenAIにより開発提供されている画像生成AI。

オートデコーダ・エンコーダという、画像を超圧縮して展開する人工知能によって構成されている。
また言葉から画像にする過程で、ChatGPTなどと同様のGPTモデルを使用している。

2022年4月にDALL-E 2が発表され、同年9月28日に一般向けに提供された。

Danbooru

ダンボール

海外のイラスト無断転載サイト。
無断ではあるが、利益を得ることや絵師に不利益を与えることは考えておらず、フェアユースの理念に則っていると言う。
著作者からの要求があれば直ちに掲載を取り下げる旨も発表している。

このページで付与されるのがDanbooruタグで、NovelAIなどはこのタグとの関係で画像を学習している。

関連項目:Deep Danbooru

Deep Danbooru

ディープダンボール

Stable Diffusion WebUIの拡張機能の一つ。
読み込んだ画像に付いていそうなDanbooruタグを探索できる。
2022年10月10日頃から利用されている。

今まで手探りでタグを探していたのだが、これによってタグの探索がものすごい勢いで進み、プロンプトが進化した。
またタグを探索できることから、他人の絵と似た絵をTxt to Imgから比較的簡単に作成できるようになった。

Glaze

グレイズ

イラストに拡散モデルAIの学習の妨げとなる微細な変化を追加することで、絵柄をAIに学習させにくくするというプログラム。
アメリカのシカゴ大学に所属する研究者によって開発された。
2023年3月20日あたりから利用が広まっている。

効果に関しては、将来的に突破される可能性もあり時間稼ぎに過ぎないという意見もあるが、意思表示として利用することに価値があるという見方もある。

h~n

Hive

ハイヴ

AI開発会社。
AIイラストか手書きかを判別するAIを制作し、Skebに提供している。
しかしこのAIは簡単な加工でAIイラストを手書きだと認識してしまうと報告されている。

Img to Img

ItoI、image to image、アイトゥーアイ、イメージトゥイメージ

広義には、画像生成AIの入力として画像を取り、画像を出力すること。
狭義には拡散モデルシードとして画像を使うこと。
プロンプトを追加してより理想に近づけることもあり、その場合でもImg to Imgと呼ぶ。

生成の段階で用いるのみで、モデル自体にフィードバックされないため、学習には当たらない。

関連項目:Txt to ImgControlNet

LoRA

Low-Rank Adaptation、ロラ

StableDiffusionなどのモデルに、追加で学習させる方法の一つ。
少数のパラメータ数のみ変更するため、ミドルハイレベルの市販のパソコンで実行できる。
この学習によって目的とする絵柄などを出しやすくすることができるという。

特定の絵描き、クリエイターを対象としてLoRAをする人もちらほら存在し、問題となってきている。

Midjourney

ミッドジャーニー

Midjourneyが2022年7月13日からオープンベータ版を提供している画像生成モデルおよびサービス。
クラウド上で動き、制限付きの無料版とい無制限の有料版が提供されている。

この提供の約1ヶ月後から提供が始まるStableDiffusionと同様に、モデルの学習データに著作権侵害がある可能性が指摘されている。

NovelAI

ノベルエーアイ

Anlatan社によって2022年10月3日より提供されている画像生成モデル、およびサービス。
StableDiffusionをベースに開発されており、クラウド上で動く有料サービス。
日本や中国、韓国の美少女イラストのような画像の生成を得意としている。

元となっているStable Diffusionと同様の著作権問題があるほか、海外の無断転載サイトDanbooruからもデータを得ていることを公言しており、より黒に近いと考える人もいる。

2022年10月6日、モデルデータがリークし、現在多くのリークモデルおよびその改変が出回っているとされる。

o~t

OpenAI

オープンエーアイ

大規模なAI開発、研究をし、全人類に利益をもたらすことを理念とする人工知能研究所。
ChatGPTDALL-Eの開発元。

Skeb

顧客が依頼を文で出し、それをイラストレーターが有償で受けるという形式のサービス。
絵師側に受けない選択肢があったり、リテイクは不可能だったり、クリエイター側に有利なサービスとして有名。

AIイラストはイラストジャンルではないとしていて、3月1日からAIイラストであるか判別するHive社のAIを導入した。

しかしこのAIにも誤検知があったり、簡単な作業のみでAIでないと誤認させることが可能なようで、完璧ではない。

Stable Diffusion

ステイブル・ディフュージョン

Stability AIが運営している、拡散モデルによる画像生成AI

Midjourneyの発表から約1ヶ月後の2022年8月22日に発表された。

オープンソース化されている上、市販のミドルクラス以上のパソコンで動くという利便性から、2023年3月現在のイラストAIはほとんどこのモデルを基礎にしている。
NovelAIもこのモデルを改良したものである。

インターネット上から大量の画像を無断で取得しているため、著作権侵害ではないかと指摘され、一部訴訟されている。

Stable Diffusion WebUI

ステイブルディフュージョン ウェブ ユーアイ

StableDiffusionをグラフィカルユーザーインターフェイスによって動かすUI。
AUTOMATIC1111が2023年3月時点での主流。

ここに拡張機能としてControlNetDeepDanbooruを導入できる。

StableDiffusionの他、それを基礎とするWaifu Diffusionリークモデルなども動かせる。

Txt to Img

TtoI、Text to Image、ティートゥアイ、テキストトゥイメージ

画像生成AIにプロンプト、言葉で指示を出して画像の出力を得ること。

拡散モデルではノイズマットをシードとして扱う。
ノイズマットをランダムにすることで、同じ指示でも出力はランダムになる。

関連項目:Img to Img

u~z

Waifu Diffusion

2022年8月から提供されている萌え絵、日本風の美少女イラストに特化した画像生成モデル。
Stable Diffusionをベースに開発されている。

NovelAIと同様、Stable Diffusionに起因する著作権問題と、Danbooruを学習データに使用している問題があるとされている。

ア行

オープンソース

open source

プログラムやAIの開発者が、そのコードやデータを一般の人が自由に使えるように公開したもの。

カ行

拡散モデル

かくさんもでる、Diffuse model

画像生成AIの学習並びに画像生成方法の一つ。
画像にノイズをかける処理およびその逆の処理を繰り返し学習することで、最終的に何も見いだせない完全なノイズから意味のある画像を出力する。
またこの学習の際に、その画像と関係する言葉と結びつけることで、言葉による指示に合わせた画像を生成できるようになる。

開発当初は、学習の仕方から、無秩序なノイズからしか画像出力できないと考えられていたが、意外にも無秩序なノイズではないところからも画像を生成できた。
これがImg to Imgへとつながっている。

MidjourneyStableDiffusionに用いられており、2023年3月現在の画像生成AIのメインストリームとなっている。

画像生成AI

がぞうせいせいえーあい

画像を生成することを目的とした人工知能。

GAN(敵対的生成ネットワーク)、オートデコーダエンコーダ拡散モデルなど様々な手法がある。

元素法典

げんそほうてん

中国の画像生成コミュニティから誕生した、NovelAIのためのプロンプト集。
2022年の10月17日に日本に持ち込まれ、神絵師級のイラストが高確率で生成できると話題になった。

ネガティブプロンプトを多用することで精度を上げているのが特徴。

しかし一部の呪文は正規のNovelAIではなく、リークモデルを使用して開発されたのではないかという疑惑がある。

サ行

シード

seed

コンピュータで疑似乱数を作るときなどに使う初期値のこと。
いくつかの画像生成AIでは、このような初期値を生成の最初に必要とする。

拡散モデルでは最終出力と同サイズのノイズマットをシードとして必要とする。
このシードが毎回ランダムに変化するため、同じプロンプトでも出力するたびに別の画像となる。

スクレイピング

scraping

プログラミングなどによってweb上からほしい情報を自動的に取得する行為。
大量にデータを収集することも可能なため、AI学習のためのデータを集めるために使われることも多い。

情報を得るために大量にアクセスすることからサーバーに負荷がかかるため、利用規約で禁止しているページもある。
また著作権の問題もある。

タ行

著作権法第30条4

ちょさくけんほうだいさんじゅうじょうのよん

著作物のAI学習を正当化しているとされる日本の法律。
詳しくは弁護士などに相談してください。

以下に条文を全部写します。

(著作物に表現された思想又は感情の享受を目的としない利用)

第三十条の四 著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。

一 著作物の録音、録画その他の利用に係る技術の開発又は実用化のための試験の用に供する場合

二 情報解析(多数の著作物その他の大量の情報から、当該情報を構成する言語、音、影像その他の要素に係る情報を抽出し、比較、分類その他の解析を行うことをいう。第四十七条の五第一項第二号において同じ。)の用に供する場合

三 前二号に掲げる場合のほか、著作物の表現についての人の知覚による認識を伴うことなく当該著作物を電子計算機による情報処理の過程における利用その他の利用(プログラムの著作物にあつては、当該著作物の電子計算機における実行を除く。)に供する場合

出典:https://elaws.e-gov.go.jp/document?lawid=345AC0000000048
2023年3月29日現在

ハ行

フェアユース

fair use

アメリカ合衆国で著作権侵害が成立するかどうかに関わる概念。
平たく言えば、公正な利用であれば著作権侵害にならないという。

何が公正なのかは難しい問題なので、専門家に相談してください。

プロンプト

prompt

画像生成AIに指示を出すための文章。
この文章から意味なり単語なりを理解し、それに合わせてAIが画像を出力する。

この用法で使われ出したのはDALL-Eが最初だが、他の画像生成AIでも同じ言葉で定着した。

出力に出してほしい要素を記述するポジティブプロンプトと、出してほしくない要素を記述するネガティブプロンプトが存在する。

絵師の名前などもプロンプトから指定できる場合があり、特定の絵師に似せた出力を作ることに対する法関係や倫理関係の問題がある。

ラ行

リークモデル

何らかの原因によって、本来オープンソースにしないはずであったAIのデータが流出したもの。
AIイラストの世界ではNovelAIのデータが流出しており、これを指してリークモデルと言っている場合が多い。

ただでさえ著作権の怪しいイラストAIの、それがさらに不正に流出しているものなので、なにかしらの法律に触れている可能性が高い。