Model files.

Browse files

Files changed (10) hide show

.gitattributes +1 -0
README.md +6 -0
best.th +3 -0
config.json +226 -0
log/train/events.out.tfevents +3 -0
log/validation/events.out.tfevents +3 -0
metrics.json +20 -0
vocabulary/.lock +0 -0
vocabulary/non_padded_namespaces.txt +2 -0
vocabulary/pos.txt +48 -0

.gitattributes CHANGED Viewed

@@ -25,3 +25,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text

 *.zip filter=lfs diff=lfs merge=lfs -text
 *.zstandard filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
+*.th filter=lfs diff=lfs merge=lfs -text

README.md ADDED Viewed

	@@ -0,0 +1,6 @@

+---
+tags:
+- allennlp
+---
+# TODO: Fill this model card

best.th ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9bbc539b197a21a12e9776bac545da7cc54b3b7eb2bfec740980c8c21dc602df
+size 504187727

config.json ADDED Viewed

	@@ -0,0 +1,226 @@

+{
+    "dataset_reader": {
+        "type": "multitask",
+        "readers": {
+            "pos": {
+                "type": "mlrs_pos",
+                "language_specific": true,
+                "token_indexers": {
+                    "transformer": {
+                        "type": "pretrained_transformer_mismatched",
+                        "max_length": 512,
+                        "model_name": "MLRS/BERTu"
+                    }
+                }
+            }
+        }
+    },
+    "model": {
+        "type": "multitask",
+        "arg_name_mapping": {
+            "backbone": {
+                "tokens": "text",
+                "words": "text"
+            }
+        },
+        "backbone": {
+            "type": "embedder_and_mask",
+            "text_field_embedder": {
+                "token_embedders": {
+                    "transformer": {
+                        "type": "pretrained_transformer_mismatched_with_dropout",
+                        "last_layer_only": false,
+                        "layer_dropout": 0.1,
+                        "max_length": 512,
+                        "model_name": "MLRS/BERTu",
+                        "tokenizer_kwargs": {},
+                        "train_parameters": true
+                    }
+                }
+            }
+        },
+        "heads": {
+            "pos": {
+                "type": "linear_tagger",
+                "dropout": 0.3,
+                "encoder": {
+                    "type": "pass_through",
+                    "input_dim": 768
+                },
+                "initializer": {
+                    "regexes": [
+                        [
+                            ".*projection.*weight",
+                            {
+                                "type": "xavier_uniform"
+                            }
+                        ],
+                        [
+                            ".*projection.*bias",
+                            {
+                                "type": "zero"
+                            }
+                        ],
+                        [
+                            ".*tag_bilinear.*weight",
+                            {
+                                "type": "xavier_uniform"
+                            }
+                        ],
+                        [
+                            ".*tag_bilinear.*bias",
+                            {
+                                "type": "zero"
+                            }
+                        ],
+                        [
+                            ".*weight_ih.*",
+                            {
+                                "type": "xavier_uniform"
+                            }
+                        ],
+                        [
+                            ".*weight_hh.*",
+                            {
+                                "type": "orthogonal"
+                            }
+                        ],
+                        [
+                            ".*bias_ih.*",
+                            {
+                                "type": "zero"
+                            }
+                        ],
+                        [
+                            ".*bias_hh.*",
+                            {
+                                "type": "lstm_hidden_bias"
+                            }
+                        ]
+                    ]
+                }
+            }
+        }
+    },
+    "train_data_path": {
+        "pos": "MLRS POS Gold/mlrs_pos-train.tsv"
+    },
+    "validation_data_path": {
+        "pos": "MLRS POS Gold/mlrs_pos-dev.tsv"
+    },
+    "trainer": {
+        "callbacks": [
+            {
+                "tensorboard_writer": {
+                    "should_log_learning_rate": true,
+                    "should_log_parameter_statistics": true
+                },
+                "type": "tensorboard"
+            }
+        ],
+        "cuda_device": 0,
+        "grad_norm": 5,
+        "learning_rate_scheduler": {
+            "type": "ulmfit_sqrt",
+            "affected_group_count": 2,
+            "decay_factor": 0.05,
+            "discriminative_fine_tuning": true,
+            "factor": 5,
+            "gradual_unfreezing": true,
+            "model_size": 1,
+            "start_step": 39,
+            "warmup_steps": 39
+        },
+        "num_epochs": 200,
+        "optimizer": {
+            "type": "huggingface_adamw",
+            "betas": [
+                0.9,
+                0.999
+            ],
+            "correct_bias": false,
+            "lr": 0.0005,
+            "parameter_groups": [
+                [
+                    [
+                        "text_field_embedder.*transformer_model.embeddings.*_embeddings.*",
+                        "text_field_embedder.*transformer_model.encoder.*.(key|query|value|dense).weight"
+                    ],
+                    {}
+                ],
+                [
+                    [
+                        "text_field_embedder.*transformer_model.embeddings.LayerNorm.*",
+                        "text_field_embedder.*transformer_model.encoder.*.output.LayerNorm.*",
+                        "text_field_embedder.*transformer_model.encoder.*.(key|query|value|dense).bias",
+                        "text_field_embedder.*transformer_model.pooler.dense.bias"
+                    ],
+                    {
+                        "weight_decay": 0
+                    }
+                ],
+                [
+                    [
+                        "text_field_embedder.*._scalar_mix.*",
+                        "text_field_embedder.*transformer_model.pooler.dense.weight",
+                        "_head_sentinel",
+                        "head_arc_feedforward._linear_layers.*.weight",
+                        "child_arc_feedforward._linear_layers.*.weight",
+                        "head_tag_feedforward._linear_layers.*.weight",
+                        "child_tag_feedforward._linear_layers.*.weight",
+                        "arc_attention._weight_matrix",
+                        "tag_bilinear.weight",
+                        "tag_projection_layer._module.weight",
+                        "crf",
+                        "linear.weight",
+                        "tagger_linear.weight"
+                    ],
+                    {}
+                ],
+                [
+                    [
+                        "head_arc_feedforward._linear_layers.*.bias",
+                        "child_arc_feedforward._linear_layers.*.bias",
+                        "head_tag_feedforward._linear_layers.*.bias",
+                        "child_tag_feedforward._linear_layers.*.bias",
+                        "arc_attention._bias",
+                        "tag_bilinear.bias",
+                        "tag_projection_layer._module.bias",
+                        "linear.bias",
+                        "tagger_linear.bias"
+                    ],
+                    {
+                        "weight_decay": 0
+                    }
+                ]
+            ],
+            "weight_decay": 0.01
+        },
+        "patience": 20,
+        "validation_metric": [
+            "+pos_accuracy"
+        ]
+    },
+    "data_loader": {
+        "type": "multitask",
+        "scheduler": {
+            "type": "unbalanced_homogeneous_roundrobin",
+            "batch_size": 128,
+            "dataset_sizes": {
+                "pos": 4935
+            }
+        },
+        "shuffle": true
+    },
+    "numpy_seed": 1337,
+    "pytorch_seed": 133,
+    "random_seed": 13370,
+    "validation_data_loader": {
+        "type": "multitask",
+        "scheduler": {
+            "type": "homogeneous_roundrobin",
+            "batch_size": 128
+        },
+        "shuffle": true
+    }
+}

log/train/events.out.tfevents ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7aee610111be68267533e274ec2043701c0551d621dbcd1584fb94e9b48d0f63
+size 2612432

log/validation/events.out.tfevents ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:9179d2186c523786665d18865ba96699609822380230c906b79816a7231081b5
+size 4630

metrics.json ADDED Viewed

	@@ -0,0 +1,20 @@

+{
+  "best_epoch": 10,
+  "peak_worker_0_memory_MB": 4651.65234375,
+  "peak_gpu_0_memory_MB": 20491.86572265625,
+  "training_duration": "0:05:16.923942",
+  "training_start_epoch": 0,
+  "training_epochs": 29,
+  "epoch": 29,
+  "training_pos_accuracy": 0.9999208681890119,
+  "training_pos_accuracy_words_only": 0.9999208681890119,
+  "training_loss": 0.0004258193467439224,
+  "training_worker_0_memory_MB": 4651.65234375,
+  "training_gpu_0_memory_MB": 20491.86572265625,
+  "validation_pos_accuracy": 0.9899515204936096,
+  "validation_pos_accuracy_words_only": 0.9899515204936096,
+  "validation_loss": 0.08878542482852936,
+  "best_validation_pos_accuracy": 0.990304098721904,
+  "best_validation_pos_accuracy_words_only": 0.990304098721904,
+  "best_validation_loss": 0.06906605958938598
+}

vocabulary/.lock ADDED Viewed

File without changes

vocabulary/non_padded_namespaces.txt ADDED Viewed

	@@ -0,0 +1,2 @@


1	+ *labels
2	+ *tags

vocabulary/pos.txt ADDED Viewed

	@@ -0,0 +1,48 @@

+@@UNKNOWN@@
+NOUN
+X_PUN
+VERB
+DEF
+PREP
+ADJ
+NOUN_PROP
+CONJ_CORD
+COMP
+PREP_DEF
+ADV
+KIEN
+GEN_DEF
+CONJ_SUB
+GEN
+PRON_INT
+PRON_DEM
+PART_PASS
+VERB_PSEU
+NEG
+QUAN
+PRON_PERS
+X_DIG
+X_ABV
+PREP_PRON
+GEN_PRON
+FOC
+PROG
+PRON_INDEF
+X_ENG
+HEMM
+FUT
+NUM_CRD
+LIL_DEF
+PRON_PERS_NEG
+PART_ACT
+NUM_WHD
+LIL
+NUM_ORD
+INT
+X_BOR
+PRON_REF
+X_FOR
+LIL_PRON
+PRON_DEM_DEF
+NUM_FRC
+PRON_REC