uploading konkani to english model

Files changed (4) hide show

.gitattributes CHANGED Viewed

@@ -34,3 +34,4 @@ saved_model/**/* filter=lfs diff=lfs merge=lfs -text
 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 best_model.weights.hdf5 filter=lfs diff=lfs merge=lfs -text

 *.zst filter=lfs diff=lfs merge=lfs -text
 *tfevents* filter=lfs diff=lfs merge=lfs -text
 best_model.weights.hdf5 filter=lfs diff=lfs merge=lfs -text
+tbase_kok-en.hdf5 filter=lfs diff=lfs merge=lfs -text

tbase_en-kok_config.env ADDED Viewed

+# -----Configurations of the Transformer model----- #
+# Model name
+MODEL_NAME=TRANS_BASE_EK
+## Path to training data of source language
+CONTEXT_DATA_PATH=dataset/FULL_DATA.en
+## Path to training data of target language
+TARGET_DATA_PATH=dataset/FULL_DATA.gom
+## Path to vocabulary of source language
+CONTEXT_TOKEN_PATH=vocabulary/bert_en.vocab
+## Path to vocabulary data of target language
+TARGET_TOKEN_PATH=vocabulary/bert_gom.vocab
+# Reloading weights from pretrained model (Comment out or leave empty or set to 'None' if not using)
+WEIGHTS_PATH=trained_models/T_BASE_EK_07_07/checkpoints/best_model.weights.hdf5
+# Set model configurations
+BATCH_SIZE=128
+MAX_TOKENS=128
+## number of encoder and decoder layers
+NUM_LAYERS=6
+## dimensionality of the embeddings
+D_MODEL=512
+## internal dimensionality of the FeedForward layer
+DFF=2048
+## The number of self-attention heads
+NUM_HEADS=8
+## Residual Dropout
+DROPOUT_RATE=0.3
+# Set Training parameters
+epochs=10
+## save only the best weight? default = True
+save_best_only=True
+## save epochs after every `save_freq`, default = 1
+save_freq=1

tbase_kok-en.hdf5 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:bb4669cdc8d3ec5ce86f3e843e4f1dcf8925ede6e51894f6111b8d2836a304a8
+size 1231670576

tbase_kok-en_config.env ADDED Viewed

+# -----Configurations of the Transformer model----- #
+# Model name
+MODEL_NAME=TRANS_BASE_KE
+## Path to training data of source language
+CONTEXT_DATA_PATH=dataset/FULL_DATA.gom
+## Path to training data of target language
+TARGET_DATA_PATH=dataset/FULL_DATA.en
+## Path to vocabulary of source language
+CONTEXT_TOKEN_PATH=vocabulary/bert_gom.vocab
+## Path to vocabulary data of target language
+TARGET_TOKEN_PATH=vocabulary/bert_en.vocab
+# Reloading weights from pretrained model (Comment out or leave empty or set to 'None' if not using)
+WEIGHTS_PATH=trained_models/T_BASE_KE_17_07/checkpoints/best_model.weights.hdf5
+# Set model configurations
+BATCH_SIZE=128
+MAX_TOKENS=128
+## number of encoder and decoder layers
+NUM_LAYERS=6
+## dimensionality of the embeddings
+D_MODEL=512
+## internal dimensionality of the FeedForward layer
+DFF=2048
+## The number of self-attention heads
+NUM_HEADS=8
+## Residual Dropout
+DROPOUT_RATE=0.3
+# Set Training parameters
+epochs=10
+## save only the best weight? default = True
+save_best_only=True
+## save epochs after every `save_freq`, default = 1
+save_freq=1