speechbrain
/

sepformer-wham-enhancement

Speech Enhancement

Model card Files Files and versions

cemsubakan commited on Feb 25, 2024

Commit

ecc66bd

·

verified ·

1 Parent(s): 2e27224

Update hyperparams.yaml

Files changed (1) hide show

hyperparams.yaml +11 -11

hyperparams.yaml CHANGED Viewed

@@ -3,7 +3,7 @@
 # Dataset : WHAM!
 # ################################
-num_spks: 1 # set to 3 for wsj0-3mix
 sample_rate: 8000
 # Encoder parameters
@@ -13,11 +13,11 @@ kernel_size: 16
 kernel_stride: 8
 # Specifying the network
-Encoder: &id003 !new:speechbrain.lobes.models.dual_path.Encoder
   kernel_size: 16
   out_channels: 256
-SBtfintra: &id001 !new:speechbrain.lobes.models.dual_path.SBTransformerBlock
   num_layers: 8
   d_model: 256
   nhead: 8
@@ -26,7 +26,7 @@ SBtfintra: &id001 !new:speechbrain.lobes.models.dual_path.SBTransformerBlock
   use_positional_encoding: true
   norm_before: true
-SBtfinter: &id002 !new:speechbrain.lobes.models.dual_path.SBTransformerBlock
   num_layers: 8
   d_model: 256
   nhead: 8
@@ -35,19 +35,19 @@ SBtfinter: &id002 !new:speechbrain.lobes.models.dual_path.SBTransformerBlock
   use_positional_encoding: true
   norm_before: true
-MaskNet: &id005 !new:speechbrain.lobes.models.dual_path.Dual_Path_Model
   num_spks: 1
   in_channels: 256
   out_channels: 256
   num_layers: 2
   K: 250
-  intra_model: *id001
-  inter_model: *id002
   norm: ln
   linear_layer_after_inter_intra: false
   skip_around_intra: true
-Decoder: &id004 !new:speechbrain.lobes.models.dual_path.Decoder
   in_channels: 256
   out_channels: 1
   kernel_size: 16
@@ -55,9 +55,9 @@ Decoder: &id004 !new:speechbrain.lobes.models.dual_path.Decoder
   bias: false
 modules:
-  encoder: *id003
-  decoder: *id004
-  masknet: *id005
 pretrainer: !new:speechbrain.utils.parameter_transfer.Pretrainer
   loadables:

 # Dataset : WHAM!
 # ################################
+num_spks: 1
 sample_rate: 8000
 # Encoder parameters
 kernel_stride: 8
 # Specifying the network
+Encoder: !new:speechbrain.lobes.models.dual_path.Encoder
   kernel_size: 16
   out_channels: 256
+SBtfintra: !new:speechbrain.lobes.models.dual_path.SBTransformerBlock
   num_layers: 8
   d_model: 256
   nhead: 8
   use_positional_encoding: true
   norm_before: true
+SBtfinter: !new:speechbrain.lobes.models.dual_path.SBTransformerBlock
   num_layers: 8
   d_model: 256
   nhead: 8
   use_positional_encoding: true
   norm_before: true
+MaskNet: !new:speechbrain.lobes.models.dual_path.Dual_Path_Model
   num_spks: 1
   in_channels: 256
   out_channels: 256
   num_layers: 2
   K: 250
+  intra_model: !ref <SBtfintra>
+  inter_model: !ref <SBtfinter>
   norm: ln
   linear_layer_after_inter_intra: false
   skip_around_intra: true
+Decoder: !new:speechbrain.lobes.models.dual_path.Decoder
   in_channels: 256
   out_channels: 1
   kernel_size: 16
   bias: false
 modules:
+  encoder: !ref <Encoder>
+  decoder: !ref <Decoder>
+  masknet: !ref <MaskNet>
 pretrainer: !new:speechbrain.utils.parameter_transfer.Pretrainer
   loadables: