{
  "best_metric": 1.2994384765625,
  "best_model_checkpoint": "resnet-18-dungeons-001/checkpoint-80",
  "epoch": 56.666666666666664,
  "eval_steps": 10,
  "global_step": 85,
  "is_hyper_param_search": false,
  "is_local_process_zero": true,
  "is_world_process_zero": true,
  "log_history": [
    {
      "epoch": 6.666666666666667,
      "grad_norm": 3.9049274921417236,
      "learning_rate": 1.0000000000000002e-06,
      "loss": 0.2236,
      "step": 10
    },
    {
      "epoch": 6.666666666666667,
      "eval_accuracy": 0.5833333333333334,
      "eval_loss": 1.567138671875,
      "eval_runtime": 0.1015,
      "eval_samples_per_second": 118.186,
      "eval_steps_per_second": 19.698,
      "step": 10
    },
    {
      "epoch": 13.333333333333334,
      "grad_norm": 4.2215895652771,
      "learning_rate": 2.0000000000000003e-06,
      "loss": 0.2873,
      "step": 20
    },
    {
      "epoch": 13.333333333333334,
      "eval_accuracy": 0.5833333333333334,
      "eval_loss": 1.5972086191177368,
      "eval_runtime": 0.102,
      "eval_samples_per_second": 117.645,
      "eval_steps_per_second": 19.608,
      "step": 20
    },
    {
      "epoch": 20.0,
      "grad_norm": 1.4720317125320435,
      "learning_rate": 3e-06,
      "loss": 0.2203,
      "step": 30
    },
    {
      "epoch": 20.0,
      "eval_accuracy": 0.6666666666666666,
      "eval_loss": 1.4836832284927368,
      "eval_runtime": 0.1006,
      "eval_samples_per_second": 119.334,
      "eval_steps_per_second": 19.889,
      "step": 30
    },
    {
      "epoch": 26.666666666666668,
      "grad_norm": 1.490944266319275,
      "learning_rate": 4.000000000000001e-06,
      "loss": 0.2063,
      "step": 40
    },
    {
      "epoch": 26.666666666666668,
      "eval_accuracy": 0.6666666666666666,
      "eval_loss": 1.4542642831802368,
      "eval_runtime": 0.1527,
      "eval_samples_per_second": 78.602,
      "eval_steps_per_second": 13.1,
      "step": 40
    },
    {
      "epoch": 33.333333333333336,
      "grad_norm": 2.723828077316284,
      "learning_rate": 5e-06,
      "loss": 0.1631,
      "step": 50
    },
    {
      "epoch": 33.333333333333336,
      "eval_accuracy": 0.6666666666666666,
      "eval_loss": 1.4692789316177368,
      "eval_runtime": 0.1017,
      "eval_samples_per_second": 117.95,
      "eval_steps_per_second": 19.658,
      "step": 50
    },
    {
      "epoch": 40.0,
      "grad_norm": 3.7070419788360596,
      "learning_rate": 6e-06,
      "loss": 0.1546,
      "step": 60
    },
    {
      "epoch": 40.0,
      "eval_accuracy": 0.5833333333333334,
      "eval_loss": 1.4473876953125,
      "eval_runtime": 0.1192,
      "eval_samples_per_second": 100.651,
      "eval_steps_per_second": 16.775,
      "step": 60
    },
    {
      "epoch": 46.666666666666664,
      "grad_norm": 1.3349393606185913,
      "learning_rate": 7e-06,
      "loss": 0.1032,
      "step": 70
    },
    {
      "epoch": 46.666666666666664,
      "eval_accuracy": 0.5833333333333334,
      "eval_loss": 1.3604329824447632,
      "eval_runtime": 0.1048,
      "eval_samples_per_second": 114.494,
      "eval_steps_per_second": 19.082,
      "step": 70
    },
    {
      "epoch": 53.333333333333336,
      "grad_norm": 1.0077532529830933,
      "learning_rate": 8.000000000000001e-06,
      "loss": 0.1101,
      "step": 80
    },
    {
      "epoch": 53.333333333333336,
      "eval_accuracy": 0.5,
      "eval_loss": 1.2994384765625,
      "eval_runtime": 0.1073,
      "eval_samples_per_second": 111.828,
      "eval_steps_per_second": 18.638,
      "step": 80
    },
    {
      "epoch": 56.666666666666664,
      "step": 85,
      "total_flos": 2.576884875160781e+16,
      "train_loss": 0.17622246672125425,
      "train_runtime": 32.2918,
      "train_samples_per_second": 118.451,
      "train_steps_per_second": 2.632
    }
  ],
  "logging_steps": 10,
  "max_steps": 85,
  "num_input_tokens_seen": 0,
  "num_train_epochs": 85,
  "save_steps": 10,
  "stateful_callbacks": {
    "TrainerControl": {
      "args": {
        "should_epoch_stop": false,
        "should_evaluate": false,
        "should_log": false,
        "should_save": true,
        "should_training_stop": true
      },
      "attributes": {}
    }
  },
  "total_flos": 2.576884875160781e+16,
  "train_batch_size": 8,
  "trial_name": null,
  "trial_params": null
}