nvidia
/

NVIDIA-Nemotron-Nano-12B-v2

Text Generation

Model card Files Files and versions

suhara commited on 4 days ago

Commit

08bd10c

·

verified ·

1 Parent(s): e539bfb

Update modeling_nemotron_h.py

Files changed (1) hide show

modeling_nemotron_h.py +1 -0

modeling_nemotron_h.py CHANGED Viewed

@@ -1112,6 +1112,7 @@ class NemotronHPreTrainedModel(PreTrainedModel):
     _no_split_modules = ["NemotronHBlock"]
     supports_gradient_checkpointing = True
     _is_stateful = True
     def _init_weights(self, module):
         """Initialize the weights."""

     _no_split_modules = ["NemotronHBlock"]
     supports_gradient_checkpointing = True
     _is_stateful = True
+    _supports_flash_attn_2 = True
     def _init_weights(self, module):
         """Initialize the weights."""