Upload folder using huggingface_hub

Browse files

Files changed (7) hide show

config.json +15 -0
merges.txt +0 -0
model.safetensors +3 -0
model.safetensors.index.json +116 -0
special_tokens_map.json +6 -0
tokenizer_config.json +8 -0
vocab.json +0 -0

config.json ADDED Viewed

	@@ -0,0 +1,15 @@

+{
+  "vocab_size": 50257,
+  "dim": 1024,
+  "num_layers": 6,
+  "num_heads": 16,
+  "max_recursion": 4,
+  "ffn_expansion": 4,
+  "max_position_embeddings": 1024,
+  "balancing_weight": 0.01,
+  "temperature": 1.0,
+  "window_size": 2048,
+  "model_type": "MoR",
+  "architecture": "MixtureOfRecursions",
+  "hidden_act": "gelu"
+}

merges.txt ADDED Viewed

The diff for this file is too large to render. See raw diff

model.safetensors ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:86c4f3c8bbc5714ed613ded25eae070c1a81123428b8c2608ef47dbc0511c848
+size 724542240

model.safetensors.index.json ADDED Viewed

	@@ -0,0 +1,116 @@

+{
+  "metadata": {
+    "total_size": 724531216
+  },
+  "weight_map": {
+    "embed.weight": "model.safetensors",
+    "pos_embed.weight": "model.safetensors",
+    "first_layer.0.weight": "model.safetensors",
+    "first_layer.0.bias": "model.safetensors",
+    "first_layer.2.weight": "model.safetensors",
+    "first_layer.2.bias": "model.safetensors",
+    "recursive_layers.0.w_q.weight": "model.safetensors",
+    "recursive_layers.0.w_q.bias": "model.safetensors",
+    "recursive_layers.0.w_k.weight": "model.safetensors",
+    "recursive_layers.0.w_k.bias": "model.safetensors",
+    "recursive_layers.0.w_v.weight": "model.safetensors",
+    "recursive_layers.0.w_v.bias": "model.safetensors",
+    "recursive_layers.0.attn_out.weight": "model.safetensors",
+    "recursive_layers.0.attn_out.bias": "model.safetensors",
+    "recursive_layers.0.ffn.0.weight": "model.safetensors",
+    "recursive_layers.0.ffn.0.bias": "model.safetensors",
+    "recursive_layers.0.ffn.2.weight": "model.safetensors",
+    "recursive_layers.0.ffn.2.bias": "model.safetensors",
+    "recursive_layers.0.norm1.weight": "model.safetensors",
+    "recursive_layers.0.norm1.bias": "model.safetensors",
+    "recursive_layers.0.norm2.weight": "model.safetensors",
+    "recursive_layers.0.norm2.bias": "model.safetensors",
+    "recursive_layers.1.w_q.weight": "model.safetensors",
+    "recursive_layers.1.w_q.bias": "model.safetensors",
+    "recursive_layers.1.w_k.weight": "model.safetensors",
+    "recursive_layers.1.w_k.bias": "model.safetensors",
+    "recursive_layers.1.w_v.weight": "model.safetensors",
+    "recursive_layers.1.w_v.bias": "model.safetensors",
+    "recursive_layers.1.attn_out.weight": "model.safetensors",
+    "recursive_layers.1.attn_out.bias": "model.safetensors",
+    "recursive_layers.1.ffn.0.weight": "model.safetensors",
+    "recursive_layers.1.ffn.0.bias": "model.safetensors",
+    "recursive_layers.1.ffn.2.weight": "model.safetensors",
+    "recursive_layers.1.ffn.2.bias": "model.safetensors",
+    "recursive_layers.1.norm1.weight": "model.safetensors",
+    "recursive_layers.1.norm1.bias": "model.safetensors",
+    "recursive_layers.1.norm2.weight": "model.safetensors",
+    "recursive_layers.1.norm2.bias": "model.safetensors",
+    "recursive_layers.2.w_q.weight": "model.safetensors",
+    "recursive_layers.2.w_q.bias": "model.safetensors",
+    "recursive_layers.2.w_k.weight": "model.safetensors",
+    "recursive_layers.2.w_k.bias": "model.safetensors",
+    "recursive_layers.2.w_v.weight": "model.safetensors",
+    "recursive_layers.2.w_v.bias": "model.safetensors",
+    "recursive_layers.2.attn_out.weight": "model.safetensors",
+    "recursive_layers.2.attn_out.bias": "model.safetensors",
+    "recursive_layers.2.ffn.0.weight": "model.safetensors",
+    "recursive_layers.2.ffn.0.bias": "model.safetensors",
+    "recursive_layers.2.ffn.2.weight": "model.safetensors",
+    "recursive_layers.2.ffn.2.bias": "model.safetensors",
+    "recursive_layers.2.norm1.weight": "model.safetensors",
+    "recursive_layers.2.norm1.bias": "model.safetensors",
+    "recursive_layers.2.norm2.weight": "model.safetensors",
+    "recursive_layers.2.norm2.bias": "model.safetensors",
+    "recursive_layers.3.w_q.weight": "model.safetensors",
+    "recursive_layers.3.w_q.bias": "model.safetensors",
+    "recursive_layers.3.w_k.weight": "model.safetensors",
+    "recursive_layers.3.w_k.bias": "model.safetensors",
+    "recursive_layers.3.w_v.weight": "model.safetensors",
+    "recursive_layers.3.w_v.bias": "model.safetensors",
+    "recursive_layers.3.attn_out.weight": "model.safetensors",
+    "recursive_layers.3.attn_out.bias": "model.safetensors",
+    "recursive_layers.3.ffn.0.weight": "model.safetensors",
+    "recursive_layers.3.ffn.0.bias": "model.safetensors",
+    "recursive_layers.3.ffn.2.weight": "model.safetensors",
+    "recursive_layers.3.ffn.2.bias": "model.safetensors",
+    "recursive_layers.3.norm1.weight": "model.safetensors",
+    "recursive_layers.3.norm1.bias": "model.safetensors",
+    "recursive_layers.3.norm2.weight": "model.safetensors",
+    "recursive_layers.3.norm2.bias": "model.safetensors",
+    "recursive_layers.4.w_q.weight": "model.safetensors",
+    "recursive_layers.4.w_q.bias": "model.safetensors",
+    "recursive_layers.4.w_k.weight": "model.safetensors",
+    "recursive_layers.4.w_k.bias": "model.safetensors",
+    "recursive_layers.4.w_v.weight": "model.safetensors",
+    "recursive_layers.4.w_v.bias": "model.safetensors",
+    "recursive_layers.4.attn_out.weight": "model.safetensors",
+    "recursive_layers.4.attn_out.bias": "model.safetensors",
+    "recursive_layers.4.ffn.0.weight": "model.safetensors",
+    "recursive_layers.4.ffn.0.bias": "model.safetensors",
+    "recursive_layers.4.ffn.2.weight": "model.safetensors",
+    "recursive_layers.4.ffn.2.bias": "model.safetensors",
+    "recursive_layers.4.norm1.weight": "model.safetensors",
+    "recursive_layers.4.norm1.bias": "model.safetensors",
+    "recursive_layers.4.norm2.weight": "model.safetensors",
+    "recursive_layers.4.norm2.bias": "model.safetensors",
+    "recursive_layers.5.w_q.weight": "model.safetensors",
+    "recursive_layers.5.w_q.bias": "model.safetensors",
+    "recursive_layers.5.w_k.weight": "model.safetensors",
+    "recursive_layers.5.w_k.bias": "model.safetensors",
+    "recursive_layers.5.w_v.weight": "model.safetensors",
+    "recursive_layers.5.w_v.bias": "model.safetensors",
+    "recursive_layers.5.attn_out.weight": "model.safetensors",
+    "recursive_layers.5.attn_out.bias": "model.safetensors",
+    "recursive_layers.5.ffn.0.weight": "model.safetensors",
+    "recursive_layers.5.ffn.0.bias": "model.safetensors",
+    "recursive_layers.5.ffn.2.weight": "model.safetensors",
+    "recursive_layers.5.ffn.2.bias": "model.safetensors",
+    "recursive_layers.5.norm1.weight": "model.safetensors",
+    "recursive_layers.5.norm1.bias": "model.safetensors",
+    "recursive_layers.5.norm2.weight": "model.safetensors",
+    "recursive_layers.5.norm2.bias": "model.safetensors",
+    "router.linear.0.weight": "model.safetensors",
+    "router.linear.0.bias": "model.safetensors",
+    "router.linear.2.weight": "model.safetensors",
+    "router.linear.2.bias": "model.safetensors",
+    "final_norm.weight": "model.safetensors",
+    "final_norm.bias": "model.safetensors",
+    "head.weight": "model.safetensors"
+  }
+}

special_tokens_map.json ADDED Viewed

	@@ -0,0 +1,6 @@

+{
+  "bos_token": "<|endoftext|>",
+  "eos_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>",
+  "pad_token": null
+}

tokenizer_config.json ADDED Viewed

	@@ -0,0 +1,8 @@

+{
+  "tokenizer_class": "GPT2Tokenizer",
+  "bos_token": "<|endoftext|>",
+  "eos_token": "<|endoftext|>",
+  "unk_token": "<|endoftext|>",
+  "pad_token": null,
+  "model_max_length": 1024
+}

vocab.json ADDED Viewed

The diff for this file is too large to render. See raw diff