Add files using upload-large-folder tool

Browse files

Files changed (12) hide show

README.md +12 -11
backbone_quantized/config.json +73 -0
backbone_quantized/qmodel.pt +3 -0
model_index.json +3 -3
scheduler/scheduler_config.json +1 -1
smash_config.json +11 -10
text_encoder/config.json +2 -2
text_encoder/model.safetensors +2 -2
text_encoder_2/config.json +2 -2
text_encoder_2/model.safetensors +2 -2
vae/config.json +2 -2
vae/diffusion_pytorch_model.safetensors +2 -2

README.md CHANGED Viewed

@@ -39,24 +39,25 @@ The compression configuration of the model is stored in the `smash_config.json`
     "batcher": null,
     "cacher": null,
     "compiler": null,
-    "factorizer": "qkv_diffusers",
     "pruner": null,
-    "quantizer": "torchao",
-    "torchao_excluded_modules": "none",
-    "torchao_quant_type": "int4dq",
     "batch_size": 1,
-    "device": "mps",
     "save_fns": [
-        "save_before_apply",
-        "save_before_apply"
     ],
     "load_fns": [
-        "diffusers"
     ],
     "reapply_after_load": {
-        "factorizer": "qkv_diffusers",
         "pruner": null,
-        "quantizer": "torchao",
         "cacher": null,
         "compiler": null,
         "batcher": null
@@ -70,4 +71,4 @@ The compression configuration of the model is stored in the `smash_config.json`
 [![GitHub](https://img.shields.io/github/followers/PrunaAI?label=Follow%20%40PrunaAI&style=social)](https://github.com/PrunaAI)
 [![LinkedIn](https://img.shields.io/badge/LinkedIn-Connect-blue)](https://www.linkedin.com/company/93832878/admin/feed/posts/?feedType=following)
 [![Discord](https://img.shields.io/badge/Discord-Join%20Us-blue?style=social&logo=discord)](https://discord.com/invite/rskEr4BZJx)
-[![Reddit](https://img.shields.io/reddit/subreddit-subscribers/PrunaAI?style=social)](https://www.reddit.com/r/PrunaAI/)

     "batcher": null,
     "cacher": null,
     "compiler": null,
+    "factorizer": null,
     "pruner": null,
+    "quantizer": "hqq_diffusers",
+    "hqq_diffusers_backend": "torchao_int4",
+    "hqq_diffusers_group_size": 64,
+    "hqq_diffusers_weight_bits": 8,
     "batch_size": 1,
+    "device": "cuda",
+    "device_map": null,
     "save_fns": [
+        "hqq_diffusers"
     ],
     "load_fns": [
+        "hqq_diffusers"
     ],
     "reapply_after_load": {
+        "factorizer": null,
         "pruner": null,
+        "quantizer": null,
         "cacher": null,
         "compiler": null,
         "batcher": null
 [![GitHub](https://img.shields.io/github/followers/PrunaAI?label=Follow%20%40PrunaAI&style=social)](https://github.com/PrunaAI)
 [![LinkedIn](https://img.shields.io/badge/LinkedIn-Connect-blue)](https://www.linkedin.com/company/93832878/admin/feed/posts/?feedType=following)
 [![Discord](https://img.shields.io/badge/Discord-Join%20Us-blue?style=social&logo=discord)](https://discord.com/invite/rskEr4BZJx)
+[![Reddit](https://img.shields.io/reddit/subreddit-subscribers/PrunaAI?style=social)](https://www.reddit.com/r/PrunaAI/)

backbone_quantized/config.json ADDED Viewed

	@@ -0,0 +1,73 @@

+{
+  "_class_name": "UNet2DConditionModel",
+  "_diffusers_version": "0.34.0",
+  "_name_or_path": "/root/.cache/huggingface/hub/models--segmind--Segmind-Vega/snapshots/7714c4363e5856ff974a4f4b068e8691f26d0b40/unet",
+  "act_fn": "silu",
+  "addition_embed_type": "text_time",
+  "addition_embed_type_num_heads": 64,
+  "addition_time_embed_dim": 256,
+  "attention_head_dim": [
+    5,
+    10,
+    20
+  ],
+  "attention_type": "default",
+  "block_out_channels": [
+    320,
+    640,
+    1280
+  ],
+  "center_input_sample": false,
+  "class_embed_type": null,
+  "class_embeddings_concat": false,
+  "conv_in_kernel": 3,
+  "conv_out_kernel": 3,
+  "cross_attention_dim": 2048,
+  "cross_attention_norm": null,
+  "down_block_types": [
+    "DownBlock2D",
+    "CrossAttnDownBlock2D",
+    "CrossAttnDownBlock2D"
+  ],
+  "downsample_padding": 1,
+  "dropout": 0.0,
+  "dual_cross_attention": false,
+  "encoder_hid_dim": null,
+  "encoder_hid_dim_type": null,
+  "flip_sin_to_cos": true,
+  "freq_shift": 0,
+  "in_channels": 4,
+  "layers_per_block": 2,
+  "mid_block_only_cross_attention": null,
+  "mid_block_scale_factor": 1,
+  "mid_block_type": "UNetMidBlock2D",
+  "norm_eps": 1e-05,
+  "norm_num_groups": 32,
+  "num_attention_heads": null,
+  "num_class_embeds": null,
+  "only_cross_attention": false,
+  "out_channels": 4,
+  "projection_class_embeddings_input_dim": 2816,
+  "resnet_out_scale_factor": 1.0,
+  "resnet_skip_time_act": false,
+  "resnet_time_scale_shift": "default",
+  "reverse_transformer_layers_per_block": null,
+  "sample_size": 128,
+  "time_cond_proj_dim": null,
+  "time_embedding_act_fn": null,
+  "time_embedding_dim": null,
+  "time_embedding_type": "positional",
+  "timestep_post_act": null,
+  "transformer_layers_per_block": [
+    1,
+    1,
+    2
+  ],
+  "up_block_types": [
+    "CrossAttnUpBlock2D",
+    "CrossAttnUpBlock2D",
+    "UpBlock2D"
+  ],
+  "upcast_attention": null,
+  "use_linear_projection": true
+}

backbone_quantized/qmodel.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b8dff1b6202099d663a8f660d89655fdf2df7d3d724bc0e4bbbd2cab1a6291b
+size 1713166505

model_index.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "_class_name": "StableDiffusionXLPipeline",
-  "_diffusers_version": "0.33.1",
   "_name_or_path": "segmind/Segmind-Vega",
   "feature_extractor": [
     null,
@@ -32,8 +32,8 @@
     "CLIPTokenizer"
   ],
   "unet": [
-    "diffusers",
-    "UNet2DConditionModel"
   ],
   "vae": [
     "diffusers",

 {
   "_class_name": "StableDiffusionXLPipeline",
+  "_diffusers_version": "0.34.0",
   "_name_or_path": "segmind/Segmind-Vega",
   "feature_extractor": [
     null,
     "CLIPTokenizer"
   ],
   "unet": [
+    null,
+    null
   ],
   "vae": [
     "diffusers",

scheduler/scheduler_config.json CHANGED Viewed

@@ -1,6 +1,6 @@
 {
   "_class_name": "EulerDiscreteScheduler",
-  "_diffusers_version": "0.33.1",
   "beta_end": 0.012,
   "beta_schedule": "scaled_linear",
   "beta_start": 0.00085,

 {
   "_class_name": "EulerDiscreteScheduler",
+  "_diffusers_version": "0.34.0",
   "beta_end": 0.012,
   "beta_schedule": "scaled_linear",
   "beta_start": 0.00085,

smash_config.json CHANGED Viewed

@@ -2,24 +2,25 @@
     "batcher": null,
     "cacher": null,
     "compiler": null,
-    "factorizer": "qkv_diffusers",
     "pruner": null,
-    "quantizer": "torchao",
-    "torchao_excluded_modules": "none",
-    "torchao_quant_type": "int4dq",
     "batch_size": 1,
-    "device": "mps",
     "save_fns": [
-        "save_before_apply",
-        "save_before_apply"
     ],
     "load_fns": [
-        "diffusers"
     ],
     "reapply_after_load": {
-        "factorizer": "qkv_diffusers",
         "pruner": null,
-        "quantizer": "torchao",
         "cacher": null,
         "compiler": null,
         "batcher": null

     "batcher": null,
     "cacher": null,
     "compiler": null,
+    "factorizer": null,
     "pruner": null,
+    "quantizer": "hqq_diffusers",
+    "hqq_diffusers_backend": "torchao_int4",
+    "hqq_diffusers_group_size": 64,
+    "hqq_diffusers_weight_bits": 8,
     "batch_size": 1,
+    "device": "cuda",
+    "device_map": null,
     "save_fns": [
+        "hqq_diffusers"
     ],
     "load_fns": [
+        "hqq_diffusers"
     ],
     "reapply_after_load": {
+        "factorizer": null,
         "pruner": null,
+        "quantizer": null,
         "cacher": null,
         "compiler": null,
         "batcher": null

text_encoder/config.json CHANGED Viewed

@@ -18,7 +18,7 @@
   "num_hidden_layers": 12,
   "pad_token_id": 1,
   "projection_dim": 768,
-  "torch_dtype": "bfloat16",
-  "transformers_version": "4.52.4",
   "vocab_size": 49408
 }

   "num_hidden_layers": 12,
   "pad_token_id": 1,
   "projection_dim": 768,
+  "torch_dtype": "float32",
+  "transformers_version": "4.53.2",
   "vocab_size": 49408
 }

text_encoder/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:4921a685a94dc5c57f74a4bf157481bfb18d375e16ada3ca93cac8c5b5a1402d
-size 246144352

 version https://git-lfs.github.com/spec/v1
+oid sha256:92b998a9a64549bfa05c019bde114be6681549a0c79caee903fe30c9444d08b9
+size 492265168

text_encoder_2/config.json CHANGED Viewed

@@ -18,7 +18,7 @@
   "num_hidden_layers": 32,
   "pad_token_id": 1,
   "projection_dim": 1280,
-  "torch_dtype": "bfloat16",
-  "transformers_version": "4.52.4",
   "vocab_size": 49408
 }

   "num_hidden_layers": 32,
   "pad_token_id": 1,
   "projection_dim": 1280,
+  "torch_dtype": "float32",
+  "transformers_version": "4.53.2",
   "vocab_size": 49408
 }

text_encoder_2/model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:64224adda1a700e7327fd781bd28e888604fd63bfff71fe70e46da89efe34702
-size 1389382688

 version https://git-lfs.github.com/spec/v1
+oid sha256:943a2924ee888295a156dd47089d67181d633b782337890af11ef4b15af17ec5
+size 2778702264

vae/config.json CHANGED Viewed

@@ -1,7 +1,7 @@
 {
   "_class_name": "AutoencoderKL",
-  "_diffusers_version": "0.33.1",
-  "_name_or_path": "/Users/davidberenstein/.cache/huggingface/hub/models--segmind--Segmind-Vega/snapshots/7714c4363e5856ff974a4f4b068e8691f26d0b40/vae",
   "act_fn": "silu",
   "block_out_channels": [
     128,

 {
   "_class_name": "AutoencoderKL",
+  "_diffusers_version": "0.34.0",
+  "_name_or_path": "/root/.cache/huggingface/hub/models--segmind--Segmind-Vega/snapshots/7714c4363e5856ff974a4f4b068e8691f26d0b40/vae",
   "act_fn": "silu",
   "block_out_channels": [
     128,

vae/diffusion_pytorch_model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:2741af7e84fe3b0a7aee02f89fa34c0858ed55f5782aab5931b94938983652da
-size 167335590

 version https://git-lfs.github.com/spec/v1
+oid sha256:1598f3d24932bcfe6634e8b618ea1e30ab1d57f5aad13a6d2de446d2199f2341
+size 334643268