Upload 10 files

Files changed (6) hide show

all_results.json ADDED Viewed

+{
+    "epoch": 5.0,
+    "eval_loss": 1.0952651500701904,
+    "eval_runtime": 163.6144,
+    "eval_samples": 40979,
+    "eval_samples_per_second": 24.491,
+    "eval_steps_per_second": 0.513,
+    "train_loss": 0.34447823324152127,
+    "train_runtime": 12106.1256,
+    "train_samples": 368811,
+    "train_samples_per_second": 14.719,
+    "train_steps_per_second": 0.46
+}

config.json CHANGED Viewed

@@ -1,5 +1,5 @@
 {
-  "_name_or_path": "./deepseek-7b-ft-full/checkpoint-5425",
   "architectures": [
     "LlamaForCausalLM"
   ],

 {
+  "_name_or_path": "/cm/shared/anhdtv7/mainframe_gpt/data/deepseek-7b-ft-full/checkpoint-5425",
   "architectures": [
     "LlamaForCausalLM"
   ],

eval_results.json ADDED Viewed

+{
+    "epoch": 5.0,
+    "eval_loss": 1.0952651500701904,
+    "eval_runtime": 163.6144,
+    "eval_samples": 40979,
+    "eval_samples_per_second": 24.491,
+    "eval_steps_per_second": 0.513
+}

train_results.json ADDED Viewed

+{
+    "epoch": 5.0,
+    "train_loss": 0.34447823324152127,
+    "train_runtime": 12106.1256,
+    "train_samples": 368811,
+    "train_samples_per_second": 14.719,
+    "train_steps_per_second": 0.46
+}

trainer_state.json ADDED Viewed

The diff for this file is too large to render. See raw diff

training_args.bin ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:3653101cf90e5c42348d4a07963a73cc9b42f82845e5a4ad7d931487eaad4f3a
+size 5880