Trained for 1 epochs and 34000 steps.

Trained with datasets ['text-embeds-pixart-filter', 'photo-concept-bucket', 'moviecollection', 'experimental', 'ethnic', 'sports', 'architecture', 'shutterstock', 'cinemamix-1mp', 'nsfw-1024', 'anatomy', 'bg20k-1024', 'yoga', 'photo-aesthetics', 'text-1mp', 'movieposters', 'normalnudes', 'pixel-art', 'signs', 'midjourney-v6-520k-raw', 'sfwbooru', 'nijijourney-v6-520k-raw', 'dalle3']
Learning rate 1e-06, batch size 24, and 1 gradient accumulation steps.
Used DDPM noise scheduler for training with epsilon prediction type and rescaled_betas_zero_snr=False
Using 'linspace' timestep spacing.
Base model: ptx0/pixart-900m-1024-ft-large
VAE: madebyollin/sdxl-vae-fp16-fix

Files changed (13) hide show

README.md +4 -4
optimizer.bin +1 -1
random_states_0.pkl +1 -1
scheduler.bin +1 -1
training_state-anatomy.json +0 -0
training_state-dalle3.json +2 -2
training_state-midjourney-v6-520k-raw.json +2 -2
training_state-nijijourney-v6-520k-raw.json +2 -2
training_state-photo-concept-bucket.json +2 -2
training_state-sfwbooru.json +0 -0
training_state-text-1mp.json +0 -0
training_state.json +1 -1
transformer/diffusion_pytorch_model.safetensors +1 -1

README.md CHANGED Viewed

@@ -62,7 +62,7 @@ You may reuse the base model text encoder for inference.
 ## Training settings
 - Training epochs: 1
-- Training steps: 33500
 - Learning rate: 1e-06
 - Effective batch size: 192
   - Micro-batch size: 24
@@ -80,7 +80,7 @@ You may reuse the base model text encoder for inference.
 ### photo-concept-bucket
 - Repeats: 0
 - Total number of images: ~564672
-- Total number of aspect buckets: 5
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None
@@ -224,7 +224,7 @@ You may reuse the base model text encoder for inference.
 ### midjourney-v6-520k-raw
 - Repeats: 0
 - Total number of images: ~513792
-- Total number of aspect buckets: 6
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None
@@ -232,7 +232,7 @@ You may reuse the base model text encoder for inference.
 ### sfwbooru
 - Repeats: 0
 - Total number of images: ~271488
-- Total number of aspect buckets: 15
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None

 ## Training settings
 - Training epochs: 1
+- Training steps: 34000
 - Learning rate: 1e-06
 - Effective batch size: 192
   - Micro-batch size: 24
 ### photo-concept-bucket
 - Repeats: 0
 - Total number of images: ~564672
+- Total number of aspect buckets: 3
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None
 ### midjourney-v6-520k-raw
 - Repeats: 0
 - Total number of images: ~513792
+- Total number of aspect buckets: 5
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None
 ### sfwbooru
 - Repeats: 0
 - Total number of images: ~271488
+- Total number of aspect buckets: 13
 - Resolution: 1.0 megapixels
 - Cropped: False
 - Crop style: None

optimizer.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:14472d29a07699ab17e3997dcc6f616a7894574f4daa718640a02ced6b5358e1
 size 5451415117

 version https://git-lfs.github.com/spec/v1
+oid sha256:50b3d45bd029df0ade2c6c33bbcd22228f7963db0eee71a203b0ba08820b1132
 size 5451415117

random_states_0.pkl CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d68b037624963260ccff0f525a9ea5bd888384f3269a5055ff33968ed25f4521
 size 16036

 version https://git-lfs.github.com/spec/v1
+oid sha256:02dcc3508692cdcb0dfce21c08530c616dfe1405f5700bfe3b88b0cc9915ac98
 size 16036

scheduler.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:48c73d666e241108e7ba5cdfae96f4db265263fb28cabc8c95e5258bd023aad5
 size 1000

 version https://git-lfs.github.com/spec/v1
+oid sha256:cfca25df8324541ee71f939b94cd9eec33004cf0d01f8cb6e29c8e907e0be0f8
 size 1000

training_state-anatomy.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state-dalle3.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:7f23f119e0d9e0ba5c22ec2febffb3f213b60d39df9a91b31c29d1e2627823cc
-size 10057125

 version https://git-lfs.github.com/spec/v1
+oid sha256:f4483a05d2b406ace7a9325613070be3c7749371e3141982fbc798badabcded6
+size 10196383

training_state-midjourney-v6-520k-raw.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4fbc93a6f6e6c17ac2badc26eb03ab447f3dc12cac20bfc849d9cc555ccc1e76
-size 8107191

 version https://git-lfs.github.com/spec/v1
+oid sha256:e8d756024349a5285cf3d4a166abe98fe79c6524a87006531345295b72efd960
+size 8322255

training_state-nijijourney-v6-520k-raw.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:1c59cd2f3b0298e6fe2debbd383d2be907de33a38dadd347409ae12aff799171
-size 8566051

 version https://git-lfs.github.com/spec/v1
+oid sha256:9c5abe6d517ef692abe6b559911eb793398a427ace2055e920e5cef287569ebf
+size 8779891

training_state-photo-concept-bucket.json CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:79c50ef8a1932d291079bf8325a0b536be6b8186167e3b9c4f3019b5860735e1
-size 6611176

 version https://git-lfs.github.com/spec/v1
+oid sha256:9d311f4cfe599fd1659caf63c0d8de90aa22c4227e2e549d7124f354d059f1d1
+size 6766125

training_state-sfwbooru.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state-text-1mp.json CHANGED Viewed

The diff for this file is too large to render. See raw diff

training_state.json CHANGED Viewed

@@ -1 +1 @@

- {"global_step": ~~33500~~, "epoch_step": 1, "epoch": 2, "exhausted_backends": ["pixel-art", "signs", "sports", "ethnic", "experimental", "movieposters", "normalnudes", "yoga", "cinemamix-1mp", "architecture", "moviecollection", "shutterstock", "nsfw-1024", "photo-aesthetics", "bg20k-1024"], "repeats": {"bookcovers": 0, "signs": 0, "normalnudes": 0, "nijijourney": 0, "movieposters": 0, "celebrities": 0, "pixel-art": 0, "propagandaposters": 0, "sports": 0, "moviecollection": 0, "gay": 0, "experimental": 0, "yoga": 0, "ethnic": 0, "cinemamix-1mp": 0, "architecture": 0, "mj-60": 0, "text-1mp": 10, "shutterstock": 0, "nsfw-1024": 0, "photo-aesthetics": 0, "anatomy": 4, "bg20k-1024": 0, "sfwbooru": 0, "midjourney-v6-520k-raw": 0, "nijijourney-v6-520k-raw": 0, "photo-concept-bucket": 0, "dalle3": 0}}

+ {"global_step": 34000, "epoch_step": 1, "epoch": 2, "exhausted_backends": ["pixel-art", "signs", "sports", "ethnic", "experimental", "movieposters", "normalnudes", "yoga", "cinemamix-1mp", "architecture", "moviecollection", "shutterstock", "nsfw-1024", "photo-aesthetics", "bg20k-1024"], "repeats": {"bookcovers": 0, "signs": 0, "normalnudes": 0, "nijijourney": 0, "movieposters": 0, "celebrities": 0, "pixel-art": 0, "propagandaposters": 0, "sports": 0, "moviecollection": 0, "gay": 0, "experimental": 0, "yoga": 0, "ethnic": 0, "cinemamix-1mp": 0, "architecture": 0, "mj-60": 0, "text-1mp": 11, "shutterstock": 0, "nsfw-1024": 0, "photo-aesthetics": 0, "anatomy": 5, "bg20k-1024": 0, "sfwbooru": 0, "midjourney-v6-520k-raw": 0, "nijijourney-v6-520k-raw": 0, "photo-concept-bucket": 0, "dalle3": 0}}

transformer/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:8f1cf352db627f1641cff1333a73a6f9c89c77a20dd6e1c6dde76c6a44fa9391
 size 1816969728

 version https://git-lfs.github.com/spec/v1
+oid sha256:6fcc29c31b1a5fff2bf5fb68a868caa098c962a4b5d423d2ce99344339d265c3
 size 1816969728