rhysjones commited on
Commit
44af4eb
1 Parent(s): d347deb

Upload training_evals.txt

Browse files
Files changed (1) hide show
  1. training_evals.txt +100 -0
training_evals.txt ADDED
@@ -0,0 +1,100 @@
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
+ {'eval_loss': 2.2260003089904785, 'eval_runtime': 150.3176, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 0.0}
2
+ {'eval_loss': 1.2592370510101318, 'eval_runtime': 150.3936, 'eval_samples_per_second': 3.172, 'eval_steps_per_second': 0.399, 'epoch': 0.03}
3
+ {'eval_loss': 1.1892958879470825, 'eval_runtime': 150.5404, 'eval_samples_per_second': 3.169, 'eval_steps_per_second': 0.399, 'epoch': 0.06}
4
+ {'eval_loss': 1.1596440076828003, 'eval_runtime': 150.2149, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 0.09}
5
+ {'eval_loss': 1.139888882637024, 'eval_runtime': 150.348, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 0.12}
6
+ {'eval_loss': 1.1273984909057617, 'eval_runtime': 150.1877, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.4, 'epoch': 0.15}
7
+ {'eval_loss': 1.1132432222366333, 'eval_runtime': 150.1483, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.18}
8
+ {'eval_loss': 1.1027272939682007, 'eval_runtime': 150.231, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 0.21}
9
+ {'eval_loss': 1.0935686826705933, 'eval_runtime': 150.1882, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.399, 'epoch': 0.24}
10
+ {'eval_loss': 1.0842406749725342, 'eval_runtime': 150.149, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.27}
11
+ {'eval_loss': 1.0797858238220215, 'eval_runtime': 150.1574, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.3}
12
+ {'eval_loss': 1.0743279457092285, 'eval_runtime': 150.1527, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.33}
13
+ {'eval_loss': 1.0684388875961304, 'eval_runtime': 150.1596, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.36}
14
+ {'eval_loss': 1.0624574422836304, 'eval_runtime': 150.2212, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 0.39}
15
+ {'eval_loss': 1.0560593605041504, 'eval_runtime': 150.2116, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.399, 'epoch': 0.42}
16
+ {'eval_loss': 1.0518683195114136, 'eval_runtime': 150.1347, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.45}
17
+ {'eval_loss': 1.0462754964828491, 'eval_runtime': 150.1725, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.4, 'epoch': 0.48}
18
+ {'eval_loss': 1.0436967611312866, 'eval_runtime': 150.1168, 'eval_samples_per_second': 3.178, 'eval_steps_per_second': 0.4, 'epoch': 0.51}
19
+ {'eval_loss': 1.0403618812561035, 'eval_runtime': 150.1124, 'eval_samples_per_second': 3.178, 'eval_steps_per_second': 0.4, 'epoch': 0.54}
20
+ {'eval_loss': 1.037323236465454, 'eval_runtime': 150.1376, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.57}
21
+ {'eval_loss': 1.029509425163269, 'eval_runtime': 150.2637, 'eval_samples_per_second': 3.174, 'eval_steps_per_second': 0.399, 'epoch': 0.6}
22
+ {'eval_loss': 1.0270969867706299, 'eval_runtime': 150.1688, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.4, 'epoch': 0.63}
23
+ {'eval_loss': 1.0219224691390991, 'eval_runtime': 150.1644, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.66}
24
+ {'eval_loss': 1.0193912982940674, 'eval_runtime': 150.2387, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 0.69}
25
+ {'eval_loss': 1.015297532081604, 'eval_runtime': 150.1703, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.4, 'epoch': 0.72}
26
+ {'eval_loss': 1.0096923112869263, 'eval_runtime': 150.148, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.75}
27
+ {'eval_loss': 1.0069936513900757, 'eval_runtime': 150.1718, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.4, 'epoch': 0.78}
28
+ {'eval_loss': 1.0039759874343872, 'eval_runtime': 150.1716, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.4, 'epoch': 0.81}
29
+ {'eval_loss': 1.000032663345337, 'eval_runtime': 150.1453, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.84}
30
+ {'eval_loss': 0.9977497458457947, 'eval_runtime': 150.186, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.4, 'epoch': 0.87}
31
+ {'eval_loss': 0.9946133494377136, 'eval_runtime': 150.1769, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.4, 'epoch': 0.9}
32
+ {'eval_loss': 0.9919686913490295, 'eval_runtime': 150.1377, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 0.93}
33
+ {'eval_loss': 0.9893234968185425, 'eval_runtime': 150.2419, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 0.96}
34
+ {'eval_loss': 0.9862492680549622, 'eval_runtime': 150.2058, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.399, 'epoch': 0.99}
35
+ {'eval_loss': 0.987989068031311, 'eval_runtime': 150.1963, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.399, 'epoch': 1.0}
36
+ {'eval_loss': 0.9866997599601746, 'eval_runtime': 150.3714, 'eval_samples_per_second': 3.172, 'eval_steps_per_second': 0.399, 'epoch': 1.03}
37
+ {'eval_loss': 0.9825169444084167, 'eval_runtime': 150.2503, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 1.06}
38
+ {'eval_loss': 0.9800065755844116, 'eval_runtime': 150.2016, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.399, 'epoch': 1.09}
39
+ {'eval_loss': 0.9812092185020447, 'eval_runtime': 150.1848, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.4, 'epoch': 1.12}
40
+ {'eval_loss': 0.9798622727394104, 'eval_runtime': 150.2462, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 1.15}
41
+ {'eval_loss': 0.9766051769256592, 'eval_runtime': 150.2522, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 1.18}
42
+ {'eval_loss': 0.971818208694458, 'eval_runtime': 150.1943, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.399, 'epoch': 1.21}
43
+ {'eval_loss': 0.9717552065849304, 'eval_runtime': 150.1293, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 1.24}
44
+ {'eval_loss': 0.9692884683609009, 'eval_runtime': 150.385, 'eval_samples_per_second': 3.172, 'eval_steps_per_second': 0.399, 'epoch': 1.27}
45
+ {'eval_loss': 0.9660636782646179, 'eval_runtime': 150.3856, 'eval_samples_per_second': 3.172, 'eval_steps_per_second': 0.399, 'epoch': 1.3}
46
+ {'eval_loss': 0.9639666676521301, 'eval_runtime': 150.4707, 'eval_samples_per_second': 3.17, 'eval_steps_per_second': 0.399, 'epoch': 1.33}
47
+ {'eval_loss': 0.9630131125450134, 'eval_runtime': 150.3635, 'eval_samples_per_second': 3.172, 'eval_steps_per_second': 0.399, 'epoch': 1.36}
48
+ {'eval_loss': 0.9612893462181091, 'eval_runtime': 150.4291, 'eval_samples_per_second': 3.171, 'eval_steps_per_second': 0.399, 'epoch': 1.39}
49
+ {'eval_loss': 0.959020733833313, 'eval_runtime': 150.3358, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 1.42}
50
+ {'eval_loss': 0.9539810419082642, 'eval_runtime': 150.3623, 'eval_samples_per_second': 3.172, 'eval_steps_per_second': 0.399, 'epoch': 1.45}
51
+ {'eval_loss': 0.9529104828834534, 'eval_runtime': 150.3424, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 1.48}
52
+ {'eval_loss': 0.9509503841400146, 'eval_runtime': 150.2805, 'eval_samples_per_second': 3.174, 'eval_steps_per_second': 0.399, 'epoch': 1.51}
53
+ {'eval_loss': 0.9489216804504395, 'eval_runtime': 150.1703, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.4, 'epoch': 1.54}
54
+ {'eval_loss': 0.9477846026420593, 'eval_runtime': 150.1936, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.399, 'epoch': 1.57}
55
+ {'eval_loss': 0.9459198713302612, 'eval_runtime': 150.4558, 'eval_samples_per_second': 3.17, 'eval_steps_per_second': 0.399, 'epoch': 1.6}
56
+ {'eval_loss': 0.9438548684120178, 'eval_runtime': 150.3717, 'eval_samples_per_second': 3.172, 'eval_steps_per_second': 0.399, 'epoch': 1.63}
57
+ {'eval_loss': 0.9423307776451111, 'eval_runtime': 150.2334, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 1.66}
58
+ {'eval_loss': 0.9412068724632263, 'eval_runtime': 150.3078, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 1.69}
59
+ {'eval_loss': 0.9392552971839905, 'eval_runtime': 150.3293, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 1.72}
60
+ {'eval_loss': 0.9379308819770813, 'eval_runtime': 150.2965, 'eval_samples_per_second': 3.174, 'eval_steps_per_second': 0.399, 'epoch': 1.75}
61
+ {'eval_loss': 0.9379382133483887, 'eval_runtime': 150.3086, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 1.78}
62
+ {'eval_loss': 0.9353558421134949, 'eval_runtime': 150.3191, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 1.81}
63
+ {'eval_loss': 0.9350724220275879, 'eval_runtime': 150.3453, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 1.84}
64
+ {'eval_loss': 0.9341053366661072, 'eval_runtime': 150.2047, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.399, 'epoch': 1.87}
65
+ {'eval_loss': 0.9323883652687073, 'eval_runtime': 150.4644, 'eval_samples_per_second': 3.17, 'eval_steps_per_second': 0.399, 'epoch': 1.9}
66
+ {'eval_loss': 0.932006299495697, 'eval_runtime': 150.4322, 'eval_samples_per_second': 3.171, 'eval_steps_per_second': 0.399, 'epoch': 1.93}
67
+ {'eval_loss': 0.9314481019973755, 'eval_runtime': 150.2567, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 1.96}
68
+ {'eval_loss': 0.930461049079895, 'eval_runtime': 150.165, 'eval_samples_per_second': 3.177, 'eval_steps_per_second': 0.4, 'epoch': 1.99}
69
+ {'eval_loss': 0.9474654197692871, 'eval_runtime': 150.3118, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 2.01}
70
+ {'eval_loss': 0.9522636532783508, 'eval_runtime': 150.4223, 'eval_samples_per_second': 3.171, 'eval_steps_per_second': 0.399, 'epoch': 2.04}
71
+ {'eval_loss': 0.9514690041542053, 'eval_runtime': 150.3061, 'eval_samples_per_second': 3.174, 'eval_steps_per_second': 0.399, 'epoch': 2.07}
72
+ {'eval_loss': 0.9515687227249146, 'eval_runtime': 150.3111, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 2.1}
73
+ {'eval_loss': 0.9538202881813049, 'eval_runtime': 150.3439, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 2.13}
74
+ {'eval_loss': 0.9525159597396851, 'eval_runtime': 150.2167, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 2.16}
75
+ {'eval_loss': 0.9528338313102722, 'eval_runtime': 150.1901, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.399, 'epoch': 2.19}
76
+ {'eval_loss': 0.9521958827972412, 'eval_runtime': 150.2718, 'eval_samples_per_second': 3.174, 'eval_steps_per_second': 0.399, 'epoch': 2.22}
77
+ {'eval_loss': 0.952122688293457, 'eval_runtime': 150.2676, 'eval_samples_per_second': 3.174, 'eval_steps_per_second': 0.399, 'epoch': 2.25}
78
+ {'eval_loss': 0.9520538449287415, 'eval_runtime': 150.2279, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 2.28}
79
+ {'eval_loss': 0.9521791934967041, 'eval_runtime': 150.2666, 'eval_samples_per_second': 3.174, 'eval_steps_per_second': 0.399, 'epoch': 2.31}
80
+ {'eval_loss': 0.9524235129356384, 'eval_runtime': 150.2382, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 2.34}
81
+ {'eval_loss': 0.9522437453269958, 'eval_runtime': 150.3594, 'eval_samples_per_second': 3.172, 'eval_steps_per_second': 0.399, 'epoch': 2.37}
82
+ {'eval_loss': 0.9521009922027588, 'eval_runtime': 150.2126, 'eval_samples_per_second': 3.176, 'eval_steps_per_second': 0.399, 'epoch': 2.4}
83
+ {'eval_loss': 0.9522040486335754, 'eval_runtime': 150.2641, 'eval_samples_per_second': 3.174, 'eval_steps_per_second': 0.399, 'epoch': 2.43}
84
+ {'eval_loss': 0.9513848423957825, 'eval_runtime': 150.3245, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 2.46}
85
+ {'eval_loss': 0.9517989158630371, 'eval_runtime': 150.3222, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 2.49}
86
+ {'eval_loss': 0.9518244862556458, 'eval_runtime': 150.321, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 2.52}
87
+ {'eval_loss': 0.9517050385475159, 'eval_runtime': 150.2787, 'eval_samples_per_second': 3.174, 'eval_steps_per_second': 0.399, 'epoch': 2.55}
88
+ {'eval_loss': 0.9516962766647339, 'eval_runtime': 150.2225, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 2.58}
89
+ {'eval_loss': 0.9518368244171143, 'eval_runtime': 150.2542, 'eval_samples_per_second': 3.175, 'eval_steps_per_second': 0.399, 'epoch': 2.61}
90
+ {'eval_loss': 0.9516659379005432, 'eval_runtime': 150.2894, 'eval_samples_per_second': 3.174, 'eval_steps_per_second': 0.399, 'epoch': 2.64}
91
+ {'eval_loss': 0.9517300128936768, 'eval_runtime': 150.7805, 'eval_samples_per_second': 3.164, 'eval_steps_per_second': 0.398, 'epoch': 2.67}
92
+ {'eval_loss': 0.9516835808753967, 'eval_runtime': 150.3336, 'eval_samples_per_second': 3.173, 'eval_steps_per_second': 0.399, 'epoch': 2.7}
93
+ {'eval_loss': 0.9517827033996582, 'eval_runtime': 150.6229, 'eval_samples_per_second': 3.167, 'eval_steps_per_second': 0.398, 'epoch': 2.73}
94
+ {'eval_loss': 0.9517173171043396, 'eval_runtime': 150.5688, 'eval_samples_per_second': 3.168, 'eval_steps_per_second': 0.398, 'epoch': 2.76}
95
+ {'eval_loss': 0.9517095685005188, 'eval_runtime': 150.5431, 'eval_samples_per_second': 3.169, 'eval_steps_per_second': 0.399, 'epoch': 2.79}
96
+ {'eval_loss': 0.9517271518707275, 'eval_runtime': 150.5595, 'eval_samples_per_second': 3.168, 'eval_steps_per_second': 0.399, 'epoch': 2.82}
97
+ {'eval_loss': 0.9517178535461426, 'eval_runtime': 150.6766, 'eval_samples_per_second': 3.166, 'eval_steps_per_second': 0.398, 'epoch': 2.85}
98
+ {'eval_loss': 0.9516977071762085, 'eval_runtime': 150.5742, 'eval_samples_per_second': 3.168, 'eval_steps_per_second': 0.398, 'epoch': 2.88}
99
+ {'eval_loss': 0.9517183303833008, 'eval_runtime': 150.5951, 'eval_samples_per_second': 3.167, 'eval_steps_per_second': 0.398, 'epoch': 2.91}
100
+ {'eval_loss': 0.9517306685447693, 'eval_runtime': 150.6502, 'eval_samples_per_second': 3.166, 'eval_steps_per_second': 0.398, 'epoch': 2.94}