◎正当な理由による書き込みの削除について:      生島英之とみられる方へ:

画像生成AIを作る ->画像>2枚


動画、画像抽出 || この掲示板へ 類似スレ 掲示板一覧 人気スレ 動画人気順

このスレへの固定リンク: http://5chb.net/r/tech/1737262341/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

1デフォルトの名無しさん
2025/01/19(日) 13:52:21.32ID:dMmOXYWM
Pytorchなどの既存の機械学習用ライブラリを使わずにC++とCUDAを使ってゼロから画像生成AIを作っている
画像生成モデルにはGAN、VAE、拡散モデルなどがあるが
巷で話題のStable DiffusionというのはVEAと拡散モデルを両方取り入れたもの
ただし、Stable Diffusionにはprompt embeddingというユーザーの入力であるテキストプロンプトをニューラルネットワークに埋め込む構造が存在しているが
自分が作ろうとしているのは単純に正規分布の乱数列を入力すると任意の画像が生成されるという改造版のStable Diffusionなので
prompt embeddingを使わない方向で行こうと思う
2◆FEfDUERNdI
2025/01/19(日) 14:34:14.09ID:dMmOXYWM
学習データはエロ画像ということもあり
もともとはPINK板にスレ建てたが
プログラム板住民ほど賢い人がいないのと、60レス目からグロ画像荒らしが来るようになったため
ここに来た次第である

https://phoebe.bbspink.com/test/read.cgi/hgame/1724853336/
3デフォルトの名無しさん
2025/01/19(日) 18:17:28.14ID:I92SXWAZ
尾行ついてるぞ
余計なもん連れて来やがって
4◆FEfDUERNdI
2025/01/19(日) 20:56:10.51ID:dMmOXYWM
>>3
よくわからないですが、尾行とは誰のことでしょうか?
5◆FEfDUERNdI
2025/01/19(日) 20:59:58.30ID:dMmOXYWM
あ、もしかして2レス目からハンドルネームがついてるのに違和感を覚えたのか
それならIDが同じであることからもわかるけど、同じ人ですよ
ただし、前に使っていたネームと違うものにしました
6デフォルトの名無しさん
2025/01/19(日) 23:33:04.94ID:xePVZNJy
AI構築って企業が金を積んで教師データ量でバトルする領域だと思ってたけど、今さら個人でどうにかなるもんなの
勉強ついでなら好きにすればいいけどさ
7デフォルトの名無しさん
2025/01/20(月) 13:40:51.06ID:G+ryJ45G
企業は馬鹿を対象に馬鹿なデータも大量に集めるから馬鹿なAIにしかならんよ
8◆FEfDUERNdI
2025/01/20(月) 18:13:35.96ID:OQDgsUSb
そこそこ知名度のある企業だと公衆の目を浴びなければいけないので
公序良俗に反するエロに進出することもできなくなるのでしょう
9◆FEfDUERNdI
2025/01/20(月) 22:14:43.77ID:OQDgsUSb
Stable Diffsionのトレーニング手順としては
VAEのトレーニングと拡散モデルのトレーニングの二つの段階に分けられる
VAEはエンコーダとデコーダを持つモデルで、画像を低次元の潜在空間に圧縮し、その表現を使って元の画像を再構築する
拡散モデルのトレーニングはVAEで学習された潜在空間上で行われる
つまり、VAEが正しく画像を圧縮と再構築できなければ、次の段階である拡散モデルのトレーニングに進むこともできない
10◆FEfDUERNdI
2025/01/20(月) 22:28:21.53ID:OQDgsUSb
VAEのトレーニングは先週から始めた
自分のPCのGPUのVRAMは16GBしかないため
もともとのstable diffusionで使われたいた512×512サイズの画像で学習することはできず、128×128で学習している

MSE lossは今では0.02なんだけど
再構築された画像はまだ微妙な感じ

画像生成AIを作る ->画像>2枚
画像生成AIを作る ->画像>2枚
11デフォルトの名無しさん
2025/01/21(火) 08:30:55.42ID:yRL5l1cZ
QRコードの質問此処で良い?
12◆FEfDUERNdI
2025/01/21(火) 17:31:17.12ID:7ESsCguq
>>11
QRコードに関しては自分は全く詳しくないが
QRコードに使う誤り訂正とか数学的な話なら興味あるので調べてわかったなら答えるかもしれない
13◆FEfDUERNdI
2025/01/21(火) 17:41:37.93ID:7ESsCguq
stable diffusionの構造に関してネットいろんな記事を見てきたけど
自分が見つけた実装レベルまで詳しく解説してくれているのは以下です

https://blog.csdn.net/xd_wjc/article/details/134441396
14◆FEfDUERNdI
2025/01/22(水) 19:22:28.21ID:3QEENyMF
数日VAEをトレーニングしてみたが
最構築された画像はどれも>>10のようなぼやけているものばかり
ChatGPTに聞いてみたところ、どうやらMSEの短所らしい
MSEはピクセル単位で誤差を判断するため、キャラクターの輪郭など全体的な特徴を評価するのが苦手
全体的な誤差を評価するために、画像の類似度を示せるSSIMがいいらしい
合っているかどうかわからないが、とりあえずMSEとSSIMを組み合わせて使おうと思う
15デフォルトの名無しさん
2025/01/22(水) 21:27:34.18ID:Ggey4yUO
stable diffusionの画像生成プロセスを観てると、夢ん中で作られていく感じに似てるとおもた
16◆FEfDUERNdI
2025/01/22(水) 22:07:43.80ID:3QEENyMF
>>15
画像に一歩ずつノイズを加えていくと、最終的には画像自体が完全にノイズになる
その逆過程を実現するのが拡散モデルです
ランダムなノイズから認識できる画像になっていくのは
確かに夢に似ているね
17デフォルトの名無しさん
2025/01/24(金) 11:01:44.72ID:BC4ZbKEp
VAEから作ってんのか
なかなか真面目じゃん
18◆FEfDUERNdI
2025/01/24(金) 18:06:04.80ID:AlhjyAq6
>>17
ありがとうございます
一応C++標準ライブラリとCUDA以外のライブラリは使わないつまりなので
VAEを作る前の段階として
tensorや主要なニューラルネットワークの層も自作しています
ただ、png画像の読み込みと出力はopencvを使い、グラフのプロットはgnuplotを使っています
どちらも複数のOSに対応しているので、環境構築は非常に簡単です
19デフォルトの名無しさん
2025/01/24(金) 18:36:35.48ID:NBK/ONYA
ソース公開する気ないならただの日記だよ?
20◆FEfDUERNdI
2025/01/24(金) 20:03:37.86ID:AlhjyAq6
ソースは完成したら公開する予定です
readme.mdはまだ書いていないのと、ライセンス関係はまだよくわからないので
今は公開できないです
21デフォルトの名無しさん
2025/01/24(金) 21:58:30.76ID:5i0pdKkE
ただの統失の日記スレ
22◆FEfDUERNdI
2025/01/24(金) 23:22:56.22ID:AlhjyAq6
そうですね
個人日記なら別にスレを建てる必要はないですね
お騒がせしてすいませんでした

lud20250415175002
このスレへの固定リンク: http://5chb.net/r/tech/1737262341/
ヒント:5chスレのurlに http://xxxx.5chb.net/xxxx のようにbを入れるだけでここでスレ保存、閲覧できます。

TOPへ TOPへ  

このエントリをはてなブックマークに追加現在登録者数177 ブックマークへ


全掲示板一覧 この掲示板へ 人気スレ | Youtube 動画 >50 >100 >200 >300 >500 >1000枚 新着画像

 ↓「画像生成AIを作る ->画像>2枚 」を見た人も見ています:
嫌儲AI画像生成部
pixiv・画像生成AI専用スレ
【朗報】画像生成AI、楽しすぎる
画像生成AIに詳しい人に質問です!
おすすめの画像生成AIアプリある?
AI画像生成マネタイズスレ ★103
AI画像生成マネタイズスレ ★138
AI画像生成マネタイズスレ ★142
AI画像生成マネタイズスレ ★111
AI画像生成マネタイズスレ ★106
AI画像生成マネタイズスレ ★153
AI画像生成マネタイズスレ ★152
AI画像生成マネタイズスレ ★151
AI画像生成マネタイズスレ ★134
AI画像生成マネタイズスレ ★154
AI画像生成マネタイズスレ ★132
AI画像生成マネタイズスレ ★126
AI画像生成マネタイズスレ ★105
AI画像生成マネタイズスレ ★116
AI画像生成マネタイズスレ ★128
AI画像生成マネタイズスレ ★126
AI画像生成マネタイズスレ ★159
嫌儲生成AI画像ギリ飽きてないぞ部
AI画像生成マネタイズスレ ★123
AI画像生成マネタイズスレ ★112
ImageFX(AI生成)で面白画像を作りましょ
AI生成画像のブームが一気に終わった★3
なんG画像生成AI部(waifudiffusion)
【速報】生成AIでロリコン画像、規制へ
AI画像生成マネタイズスレ ★145
AI画像生成マネタイズスレ ★148
AI画像生成マネタイズスレ ★135
AI画像生成マネタイズスレ ★152
AI画像生成マネタイズスレ ★104
AI画像生成マネタイズスレ ★123
AI画像生成マネタイズスレ ★165
AI画像生成マネタイズスレ ★150
AI画像生成マネタイズスレ ★117
嫌儲・AIでエロ画像生成やめられない部
AI画像生成マネタイズスレ ★125
AI画像生成マネタイズスレ ★120
AI画像生成マネタイズスレ ★155
AI画像生成マネタイズスレ ★118
AI画像生成マネタイズスレ ★169
AI画像生成マネタイズスレ ★113
AI画像生成マネタイズスレ ★162
AI画像生成マネタイズスレ ★136
AIイラスト、画像生成AI総合 ★6枚目
【悲報】反AI Xに画像生成機能が搭載され終わる
AIイラスト、画像生成AI総合 ★3枚目
AIイラスト、画像生成AI総合 ★5枚目
カプコンがゲーム作りに画像生成AI活用
【画像】岡くん、作画AIにより自動生成される
【StableDiffusion】画像生成AI質問スレ27
AIさん、人間の脳から画像生成をできるようになる。
画像生成AIに詳しいやつちょっと来てくれないか
AIイラスト、画像生成AI総合 ★7枚目
【StableDiffusion】画像生成AI質問スレ21
【StableDiffusion】画像生成AI質問スレ20
【StableDiffusion】画像生成AI質問スレ15
【StableDiffusion】画像生成AI質問スレ23
NHK、ついに画像生成AI問題を取り上げる😙
画像生成AIにキレてる絵師の囲い多くてワロタ
【StableDiffusion】画像生成AI質問スレ23
AIで画像生成してる人のマネタイズ関連スレ ★34
17:41:47 up 62 days, 18:40, 0 users, load average: 10.06, 10.39, 10.40

in 2.4038259983063 sec @2.4038259983063@0b7 on 061906