Training in progress, epoch 1

Files changed (3) hide show

config.json CHANGED Viewed

@@ -1,7 +1,8 @@
 {
   "_name_or_path": "roberta-base",
   "architectures": [
-    "RobertaForMaskedLM"
   ],
   "attention_probs_dropout_prob": 0.1,
   "bos_token_id": 0,
@@ -12,6 +13,7 @@
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 514,
   "model_type": "roberta",

 {
   "_name_or_path": "roberta-base",
+  "add_cross_attention": true,
   "architectures": [
+    "RobertaForCausalLM"
   ],
   "attention_probs_dropout_prob": 0.1,
   "bos_token_id": 0,
   "hidden_size": 768,
   "initializer_range": 0.02,
   "intermediate_size": 3072,
+  "is_decoder": true,
   "layer_norm_eps": 1e-05,
   "max_position_embeddings": 514,
   "model_type": "roberta",

model.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:00869a6539e9651d25afa1675e5d71a3d17d4fe1d653c4080bb02b7e579db7ea
-size 498813948

 version https://git-lfs.github.com/spec/v1
+oid sha256:c7d15dc981775834b8377397e85ed059db46951d06908a4b7ce7d5c9fb4da792
+size 612296700

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:b3fe5b8247adb61730fe65c50089e9709888575bde282883ba5246a21215c1da
-size 5112

 version https://git-lfs.github.com/spec/v1
+oid sha256:57d922e814de1afdf2200038bc23105dc7c702109259328586e84d6b898984c6
+size 5304