stabilityai
/

stable-diffusion-xl-1.0-tensorrt

stable-diffusion

stable-diffusion-xl

stable-diffusion-xl-lcm

stable-diffusion-xl-lcmlora

Model card Files Files and versions Community

pharmapsychotic commited on Aug 22, 2023

Commit

0e13e08

•

1 Parent(s): c58b854

Updated README

Files changed (2) hide show

README.md +22 -10
examples.jpg +0 -0

README.md CHANGED Viewed

@@ -1,9 +1,11 @@
 ---
 license: openrail++
 language:
   - en
 tags:
   - stable-diffusion
   - tensorrt
   - text-to-image
 ---
@@ -13,19 +15,29 @@ tags:
 ### Introduction
 This repository contains Stable Diffusion XL 1.0 ONNX models compatible with TensorRT.
-Source models:
-- [SDXL base 1.0](https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0)
-- [SDXL refiner 1.0](https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-1.0)
-### Benchmark
-Timings at 1024x1024
-|      | CLIP    | UNet 40 steps | VAE decode | Pipline     | Throughput   |
-|------|---------|---------------|------------|-------------|--------------|
-| A10  | 8.98 ms | 12576.53 ms   | 0.00 ms    | 12588.26 ms | 0.08 image/s |
-| A100 | 5.99 ms | 3358.87 ms    | 0.00 ms    | 3367.04 ms  | 0.30 image/s |
-| H100 | 4.70 ms | 1772.29 ms    | 0.00 ms    | 1779.01 ms  | 0.56 image/s |
 ### Model Description

 ---
 license: openrail++
+base_model: stabilityai/stable-diffusion-xl-base-1.0
 language:
   - en
 tags:
   - stable-diffusion
+  - stable-diffusion-xl
   - tensorrt
   - text-to-image
 ---
 ### Introduction
 This repository contains Stable Diffusion XL 1.0 ONNX models compatible with TensorRT.
+See [SDXL base 1.0](https://huggingface.co/stabilityai/stable-diffusion-xl-base-1.0) and [SDXL refiner 1.0](https://huggingface.co/stabilityai/stable-diffusion-xl-refiner-1.0) for the source models.
+![examples](./examples.jpg)
+### Performance Comparison
+Timings for 30 steps at 1024x1024
+| Accelerator | Baseline (non-optimized) | NVIDIA TensorRT (optimized) | Percentage improvement |
+|-------------|--------------------------|-----------------------------|------------------------|
+| A10         | 9399 ms                  | 8160 ms                     | ~13%                   |
+| A100        | 3704 ms                  | 2742 ms                     | ~26%                   |
+| H100        | 2496 ms                  | 1471 ms                     | ~41%                   |
+Image throughput for 30 steps
+| Accelerator | Baseline (non-optimized) | NVIDIA TensorRT (optimized) | Percentage improvement |
+|-------------|--------------------------|-----------------------------|------------------------|
+| A10         | 0.10 images/sec          | 0.12 images/sec             | ~20%                   |
+| A100        | 0.27 images/sec          | 0.36 images/sec             | ~33%                   |
+| H100        | 0.40 images/sec          | 0.68 images/sec             | ~70%                   |
 ### Model Description

examples.jpg ADDED Viewed